Changes between Initial Version and Version 1 of Catalogue/Minutes/2012_04_02


Ignore:
Timestamp:
Apr 11, 2012 2:26:08 PM (13 years ago)
Author:
Morris Swertz
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • Catalogue/Minutes/2012_04_02

    v1 v1  
     1= BBMRI-NL Catalogue Working Group 2012/04/02 =
     2
     3Att: Morris Swertz, Willem de Bruijn, Teun Oosterbaan, David van Enckvoort, Gerard van Grootheest, Eric Vermeulen, Annet Sollie
     4
     5Annet & Teun presenteren use case studie:
     6
     7* In opdracht van BBMRI-NL stuurgroep
     8* Inventarisatie voor Catalogus / Biobank hub
     9* 10 interviews: LL, NESDA, VU, etc
     10* vandaag werkbespreking
     11
     12Vragen gesteld:
     13* behoefte, belangen, voordelen nationale catalogus
     14* wat kan je bieden
     15* wat zou je vragen (use cases)
     16* eigen initiatieven
     17* best practices (weinig resultaten)
     18
     19== Intro ==
     20* belang van catalogus vooral voor grote studies (verder dan 1 cohort)
     21* sommige heel sceptisch want kost zoveel energie om catalogus te vullen (vaak als zelf groot cohort)
     22* knelpunten:
     23        * niet meer administratieve last (up to date zonder enorm veel energie)
     24        * daarom ingezoomed op gebruik (use cases) van nationale catalogus (vraagkant)
     25
     26== Resultaten ==
     27
     28* gematched met de 5 catalogus nivo's
     29* type variabelen waarover info nodig is (bijv: ziekte=ALS, risico factor=roken)
     30* opvallend:
     31        * er is een kernset van variabelen die altijd terug komt
     32        * catalogus van nivo 1 (huidige catalogus) niet bruikbaar
     33                * met wil al snel geaggregeerde data
     34        * metadata is al direct nodig
     35                * 'hoe is de data verzameld?'= protocollen/vragenlijsten, volledigheid, beschikbaarheid samples
     36               
     37== Refinement van nivo's ==
     38
     39Zie sheets: counts over use cases.
     40
     41* level 1: list_coh = list of cohorts
     42* level 2: var_coh = list of cohorts incl variables / metadata
     43* level 3: agg_data = list of cohort incl aggr data per variable (e.g. num samples having ALS diagnosis)
     44        * level 3b: agg_dat_combinable = option to ask combinations (e.g. num samples having [ALS and <21y])
     45* level 4: ind_data = list of individuals incl values per variable
     46* level 5: linked_data = all of above incl references (ttp?) to other data sets
     47
     48== Refinement van variables ==
     49
     50Zie sheets. Geteld per use case.
     51
     52Bijv:
     53* diagnosis (26x)
     54* data_birth
     55* date of dignosis
     56* medication
     57* genes measured
     58* genotype data (=gwas)
     59
     60== Conclusion ==
     61
     62Start with level 2/3 at national catalogi
     63Start with level 3-5 for local catalogi
     64* als BBMRI service?
     65* ondersteuning van eigen geaggregeerde tools
     66* pseudonimisatie service
     67* organisatie
     68
     69== Discussion ==
     70
     71>Kritiek over nut?
     72>>Die scepsis is terecht voor de grote biobanken totdat weer wens is voor integratie. Daarnaast verwachten we dat behoefte gaat groeien zodra catalogus er is.
     73
     74>Angst meer werk opleveren?
     75Onterecht omdat veel van de vragen nu door het systeem beantwoord kunnen worden ipv heel breed alle cohorten aanschrijven.
     76
     77>Waar komt angst vandaan voor vele werken?
     78>>Veel mensen nu in hoofd lijst 1. Die vragen betekenen werk. Als je naar nivo 2 gaat dan ga je data dictionaries uploaden.
     79
     80>Level 3 vraagt heel erg veel van de organisatie?
     81>>Want impliceert dat men intern een level 4 catalogus heeft. Maar in de praktijk hoeft dat niet natuurlijk op alle variabelen, of in complete detail (bijv: alleen geboortejaar). En dan zou het misschien wel kunnen om die centraal te zetten?
     82
     83>We willen niet dat iedereen erbij kunt
     84>> Kun je deels technisch of procedureel afvangen.
     85
     86>herklassificeren hangt op goed klassen
     87>>Bijvoorbeeld ziekte klassen zijn niet altijd goed (soms te fijn, soms te grof).
     88
     89>kunnen we deze gegevens eigenlijk delen
     90>>wat wel altijd kan is: we hebben zoveel patienten, en van iedereen weten we welke diagnosen zijn gesteld, en hoeveel. Dat levert level 3 catalogus maar alleen per variabele. In hoeverre is er consent om te delen? (soms kan dat alleen per subcohort, bijv NESDA). Daarnaast dus ook aangeven in hoeverre dit onbekend is.
     91
     92== Wat zouden we moeten doen voor level 3 ==
     93
     94>privacy van patienten en zorgverleners is gewaarborgd
     95>> Kan door middel van het verbergen van te fijnmazige getallen (dwz 'getrunkeerde data')
     96
     97>niet iedereen kan erbij (per variabele)
     98
     99>verschillende catalogue naast elkaar?
     100>> Bijvoorbeeld voor bepaalde ziekten. Dan hoef je niet alle variablen op te hoesten.
     101
     102>samenwerking internationaal
     103>>Specifiek per ziekten, vooral als de populatie cases klein is.
     104
     105>synchronisatie? Hoe zorgen we dat data gaat vloeien tussen verschillende lokale en nationale catalogie
     106>>hier lopen we direct tegenaan, bijvoorbeeld LifeLines, Credo: 'een keer goed verzamelen en dan vaak gebruiken'
     107
     108
     109== Actieplan (wat deels ook in eindrapport kan komen?) ==
     110
     111* Roadmap afschrijven (annet en teun)
     112
     113* Eerste stap: data dictionaries mappen op variabelen
     114        * Bijv: Date of Birth
     115        * Dit impliceert een simpel data uitwissel format
     116
     117* Pilot studie definieren met
     118        * Een paar biobanken (LifeLines, Mondriaan, PSI, Twin registry)
     119        * Een paar use cases (liefst gedreven door BBMRI-NL use cases)
     120       
     121* In parallel een demo systeem opzetten
     122        * selectie van use cases maken om te demonstreren
     123        * Gesimuleerde data om te testen
     124        * Basis user interface om inzichtelijk te maken waar we op mikken
     125        * Een wiki met wireframes
     126
     127* Overzicht maken van bestaande systemen
     128        * Bijv pseudonimisatie bij Mondriaan
     129       
     130* Governance
     131        * Hoe organiseren we dat netjes?
     132        * Hoe gaan we dit betalen (kan het uit bestaande fondsen? Wat moet er nog bij?)
     133        * Zijn er ook use cases die geld gaan genereren van BBMRI-NL (meaningful use)?
     134       
     135* Poolings vraag
     136        * combineren en ontdubbelen van individuen in grote cohort
     137
     138* Verrijkings vraag
     139        * kunnen koppelen van individuen zodat je complementaire info aan elkaar kan knopen
     140       
     141* Technische afspraak maken met participerende biobanken.
     142        * Dwz simpele technische interfaces voor
     143                * metadata
     144                * getrunkeerde data uitwisselen / federatief bevragen
     145               
     146(nagekomen: weer een voorbeeld van cataloguing efforts @ http://epi.grants.cancer.gov/biospecimens.html)
     147