| 1 | = BBMRI-NL Catalogue Working Group 2012/04/02 = |
| 2 | |
| 3 | Att: Morris Swertz, Willem de Bruijn, Teun Oosterbaan, David van Enckvoort, Gerard van Grootheest, Eric Vermeulen, Annet Sollie |
| 4 | |
| 5 | Annet & Teun presenteren use case studie: |
| 6 | |
| 7 | * In opdracht van BBMRI-NL stuurgroep |
| 8 | * Inventarisatie voor Catalogus / Biobank hub |
| 9 | * 10 interviews: LL, NESDA, VU, etc |
| 10 | * vandaag werkbespreking |
| 11 | |
| 12 | Vragen gesteld: |
| 13 | * behoefte, belangen, voordelen nationale catalogus |
| 14 | * wat kan je bieden |
| 15 | * wat zou je vragen (use cases) |
| 16 | * eigen initiatieven |
| 17 | * best practices (weinig resultaten) |
| 18 | |
| 19 | == Intro == |
| 20 | * belang van catalogus vooral voor grote studies (verder dan 1 cohort) |
| 21 | * sommige heel sceptisch want kost zoveel energie om catalogus te vullen (vaak als zelf groot cohort) |
| 22 | * knelpunten: |
| 23 | * niet meer administratieve last (up to date zonder enorm veel energie) |
| 24 | * daarom ingezoomed op gebruik (use cases) van nationale catalogus (vraagkant) |
| 25 | |
| 26 | == Resultaten == |
| 27 | |
| 28 | * gematched met de 5 catalogus nivo's |
| 29 | * type variabelen waarover info nodig is (bijv: ziekte=ALS, risico factor=roken) |
| 30 | * opvallend: |
| 31 | * er is een kernset van variabelen die altijd terug komt |
| 32 | * catalogus van nivo 1 (huidige catalogus) niet bruikbaar |
| 33 | * met wil al snel geaggregeerde data |
| 34 | * metadata is al direct nodig |
| 35 | * 'hoe is de data verzameld?'= protocollen/vragenlijsten, volledigheid, beschikbaarheid samples |
| 36 | |
| 37 | == Refinement van nivo's == |
| 38 | |
| 39 | Zie sheets: counts over use cases. |
| 40 | |
| 41 | * level 1: list_coh = list of cohorts |
| 42 | * level 2: var_coh = list of cohorts incl variables / metadata |
| 43 | * level 3: agg_data = list of cohort incl aggr data per variable (e.g. num samples having ALS diagnosis) |
| 44 | * level 3b: agg_dat_combinable = option to ask combinations (e.g. num samples having [ALS and <21y]) |
| 45 | * level 4: ind_data = list of individuals incl values per variable |
| 46 | * level 5: linked_data = all of above incl references (ttp?) to other data sets |
| 47 | |
| 48 | == Refinement van variables == |
| 49 | |
| 50 | Zie sheets. Geteld per use case. |
| 51 | |
| 52 | Bijv: |
| 53 | * diagnosis (26x) |
| 54 | * data_birth |
| 55 | * date of dignosis |
| 56 | * medication |
| 57 | * genes measured |
| 58 | * genotype data (=gwas) |
| 59 | |
| 60 | == Conclusion == |
| 61 | |
| 62 | Start with level 2/3 at national catalogi |
| 63 | Start with level 3-5 for local catalogi |
| 64 | * als BBMRI service? |
| 65 | * ondersteuning van eigen geaggregeerde tools |
| 66 | * pseudonimisatie service |
| 67 | * organisatie |
| 68 | |
| 69 | == Discussion == |
| 70 | |
| 71 | >Kritiek over nut? |
| 72 | >>Die scepsis is terecht voor de grote biobanken totdat weer wens is voor integratie. Daarnaast verwachten we dat behoefte gaat groeien zodra catalogus er is. |
| 73 | |
| 74 | >Angst meer werk opleveren? |
| 75 | Onterecht omdat veel van de vragen nu door het systeem beantwoord kunnen worden ipv heel breed alle cohorten aanschrijven. |
| 76 | |
| 77 | >Waar komt angst vandaan voor vele werken? |
| 78 | >>Veel mensen nu in hoofd lijst 1. Die vragen betekenen werk. Als je naar nivo 2 gaat dan ga je data dictionaries uploaden. |
| 79 | |
| 80 | >Level 3 vraagt heel erg veel van de organisatie? |
| 81 | >>Want impliceert dat men intern een level 4 catalogus heeft. Maar in de praktijk hoeft dat niet natuurlijk op alle variabelen, of in complete detail (bijv: alleen geboortejaar). En dan zou het misschien wel kunnen om die centraal te zetten? |
| 82 | |
| 83 | >We willen niet dat iedereen erbij kunt |
| 84 | >> Kun je deels technisch of procedureel afvangen. |
| 85 | |
| 86 | >herklassificeren hangt op goed klassen |
| 87 | >>Bijvoorbeeld ziekte klassen zijn niet altijd goed (soms te fijn, soms te grof). |
| 88 | |
| 89 | >kunnen we deze gegevens eigenlijk delen |
| 90 | >>wat wel altijd kan is: we hebben zoveel patienten, en van iedereen weten we welke diagnosen zijn gesteld, en hoeveel. Dat levert level 3 catalogus maar alleen per variabele. In hoeverre is er consent om te delen? (soms kan dat alleen per subcohort, bijv NESDA). Daarnaast dus ook aangeven in hoeverre dit onbekend is. |
| 91 | |
| 92 | == Wat zouden we moeten doen voor level 3 == |
| 93 | |
| 94 | >privacy van patienten en zorgverleners is gewaarborgd |
| 95 | >> Kan door middel van het verbergen van te fijnmazige getallen (dwz 'getrunkeerde data') |
| 96 | |
| 97 | >niet iedereen kan erbij (per variabele) |
| 98 | |
| 99 | >verschillende catalogue naast elkaar? |
| 100 | >> Bijvoorbeeld voor bepaalde ziekten. Dan hoef je niet alle variablen op te hoesten. |
| 101 | |
| 102 | >samenwerking internationaal |
| 103 | >>Specifiek per ziekten, vooral als de populatie cases klein is. |
| 104 | |
| 105 | >synchronisatie? Hoe zorgen we dat data gaat vloeien tussen verschillende lokale en nationale catalogie |
| 106 | >>hier lopen we direct tegenaan, bijvoorbeeld LifeLines, Credo: 'een keer goed verzamelen en dan vaak gebruiken' |
| 107 | |
| 108 | |
| 109 | == Actieplan (wat deels ook in eindrapport kan komen?) == |
| 110 | |
| 111 | * Roadmap afschrijven (annet en teun) |
| 112 | |
| 113 | * Eerste stap: data dictionaries mappen op variabelen |
| 114 | * Bijv: Date of Birth |
| 115 | * Dit impliceert een simpel data uitwissel format |
| 116 | |
| 117 | * Pilot studie definieren met |
| 118 | * Een paar biobanken (LifeLines, Mondriaan, PSI, Twin registry) |
| 119 | * Een paar use cases (liefst gedreven door BBMRI-NL use cases) |
| 120 | |
| 121 | * In parallel een demo systeem opzetten |
| 122 | * selectie van use cases maken om te demonstreren |
| 123 | * Gesimuleerde data om te testen |
| 124 | * Basis user interface om inzichtelijk te maken waar we op mikken |
| 125 | * Een wiki met wireframes |
| 126 | |
| 127 | * Overzicht maken van bestaande systemen |
| 128 | * Bijv pseudonimisatie bij Mondriaan |
| 129 | |
| 130 | * Governance |
| 131 | * Hoe organiseren we dat netjes? |
| 132 | * Hoe gaan we dit betalen (kan het uit bestaande fondsen? Wat moet er nog bij?) |
| 133 | * Zijn er ook use cases die geld gaan genereren van BBMRI-NL (meaningful use)? |
| 134 | |
| 135 | * Poolings vraag |
| 136 | * combineren en ontdubbelen van individuen in grote cohort |
| 137 | |
| 138 | * Verrijkings vraag |
| 139 | * kunnen koppelen van individuen zodat je complementaire info aan elkaar kan knopen |
| 140 | |
| 141 | * Technische afspraak maken met participerende biobanken. |
| 142 | * Dwz simpele technische interfaces voor |
| 143 | * metadata |
| 144 | * getrunkeerde data uitwisselen / federatief bevragen |
| 145 | |
| 146 | (nagekomen: weer een voorbeeld van cataloguing efforts @ http://epi.grants.cancer.gov/biospecimens.html) |
| 147 | |