Félmillió ember DNS-adata a világhálón
Hogyan változik meg a betegségek tanulmányozása és a tudományos publikálás a nyilvánossá váló hatalmas genetikai adatbázisok révén? A UK Biobank és a bioRxiv demokratizálja a genetikai kutatást.
A UK Biobank 500.000 önkéntest követ, akik egészségi adatai mindenki számára elérhetőek a neten; a brit állami forrásokból (a National Health Service büdzséjéből) finanszírozott szolgáltatás célja, hogy javítsa a betegségmegelőzés, a diagnózis és a terápia hatásfokát számos betegség (pl. rák, szívbetegség, stroke, diabetes, arthritis, osteoporosis, szembetegségek, depresszió, demencia) esetében; a projekt első önkéntese 2006-ban adta át vizeletét és vérét a banknak, ami a vér- és vizeletminta adatain kívül rögzítette az önkéntesek testmagasságát, súlyát, vérnyomását, a munkatársak megmérték a vizsgálati alanyok kognitív funkcióját, csontdenzitását, fogáserejét, szkennelték agyukat, májukat, szívüket, elemezték DNS-üket.
A begyűjtött adatmennyiség egyedülálló, már a minták kezelése is logisztikai kihívást jelentett, írja a projektről beszámoló The Atlantic-cikk (Sarah Zhang: What Happens When You Put 500,000 People's DNA Online), sőt végeredményeképpen a UK Biobank összeállította a valaha volt legnagyobb genetikai adatbázist. 11 évvel az indulás után, idén tavasszal a szervezet bejelentette, hogy regisztrált kutatók számára a teljes adatmennyiséget hozzáférhetővé teszi. Mivel így virtuálisan bármely betegség genetikai meghatározói és egyéb karakterisztikumai kutathatóvá váltak, a lapnak nyilatkozó genetikusok elmondása szerint nyáron a szakmában senki nem ment szabadságra.
A UK Biobank már korábban is hozott nyilvánosságra nagy mennyiségű genetikai információt (legutóbb 100 000 emberét), azonban a tudományos munka eddig teljesen másféleképpen zajlott: a kutatócsoportok az adatok alapján megírták a tanulmányaikat, majd azt benyújtották a szakfolyóiratoknak, vártak a kollégák bírálataira, és végül a cikkhez a nagyközönség is hozzáférhetett. A múlt évben azonban egy népszerű honlap – a bioRxiv – megváltoztatta a játékszabályokat: a website-on a biológusok kollegiális bírálat nélkül is publikálhatják a tanulmányaik első verzióját.
A UK Biobank adatainak nyilvánossá tétele után elkezdtek áradni a tanulmányok a bioRxiv-re. A University of Edinburgh pszichiáter kutatói, David Howard és Andrew McIntosh például rögtön két tanulmányt is megjelentettek, az egyikben a depresszióval, a másikban a neuroticizmussal összefüggő genetikai variánsokat tárgyalták (Genome-wide association study of depression phenotypes in UK Biobank (n = 322,580) identifies the enrichment of variants in excitatory synaptic pathways; illetve 116 independent genetic variants influence the neuroticism personality trait in over 329,000 UK Biobank individuals); a tanulmányok azóta is ömlenek a honlapra, és egyesek szerint a genetika tudománya sose fejlődött olyan gyorsan, mint napjainkban.
A kutatók számára néhány ezer dolláros regisztrációs díj megfizetése után szabadon hozzáférhető adatmennyiség nemcsak azért különleges, mert hatalmas, hanem azért is, mert mindenki egyszerre juthat hozzá az információkhoz: senkinek nincs elsőbbségi joga, még azoknak sem, akik a szekvenálást végzik. Manny Rivas, aStanford University biostatisztikusa szerint a gazdag és széles merítésű adatbázishoz való hozzáférés egyenesen demokratizálja a genetikai kutatást.
A kutatók számára egyformán hozzáférhető adatbázison felül néhány kutatócsoport számos szabadon hozzáférhető adatbányász eszközt is kifejlesztett a UK Biobank tanulmányozására. A University of Edinburgh munkatársai által létrehozott GeneAtlas pl. a rokonok kiszűrését, és így a genetikai variánsok és a betegségek közötti kapcsolat megtalálását teszi lehetővé; a GeneAtlas és a hozzá hasonló eszközök ráadásul bárki, nemcsak a biobank regisztrációs díját kifizető kutatók számára hozzáférhető.
Eddig az egy-egy tulajdonság (betegség) hátterében álló genetikai variánsok megtalálása önmagában is tanulmányt érdemelt, a teljesgenom asszociációs vizsgálatok (GWAS) eredményei a legnevesebb szaklapokban jelenhettek meg. Most egy-egy kutatócsoport akár 2500 GWAS-t is elvégez egyetlen nap alatt, és nem törődnek azzal, hogy szaklapoknál álljanak sorban, inkább saját blogjukon publikálják az eredményeket (pl. Ben Neale és munkatársai: Rapid GWAS of thousands of phenotypes for 337,000 samples in the UK Biobank), amikből aztán más kutatók továbbépítkezhetnek. Ma már általános, hogy a neves szaklapokban – pl. Nature Genetics – megjelent írásokat jópár hónappal korábban már olvashattuk a bioRxiv-on.
Azonban a UK Biobank nemcsak könnyebbé tette a genetikai kutatást, a minőségi követelmények szintjét is megemelte: ma már nem elég szimplán felsorolni azokat a genetikai variánsokat, amik összefüggésben állhatnak egy-egy tulajdonsággal, azt is ki kell mutatnia egy komoly vizsgálatnak, hogy az adott genetikai variáns, amire a GWAS segítségével rátaláltak, hogyan eredményezheti az adott tulajdonságot (betegséget).
A UK Biobank a tervek szerint a következő évtizedekben tovább követi félmillió önkéntesét, és a megszerzett adatok 9 hónap elteltével nemcsak a szponzoráló gyógyszercégek, de a széles kutatóközösség számára is elérhetők lesznek a világhálón.