Időzár a tudományos adatokon
A világ első távirata ma is olvasható az amerikai kongresszusi könyvtárban, az első e-mail viszont már csak az emlékekben él. A példa – amelyet a New Scientist hozott fel – talán nem a legszemléletesebb, de annak igazolására mégis alkalmas, hogy az adattárolási technológiák fejlődése egyáltalán nem járt együtt az információmegőrzés időtartamának növekedésével. Mivel az emberiség kollektív tudása a tudományban nő a leggyorsabban, a jelenség ezen a területen a legfenyegetőbb – ugyanakkor az adattárolás problémái nem csak a tudományos életet fenyegetik.
A veszély a 70-es évek óta ismert: a NASA és az Európai Űrügynökség akkori kutatási projektjeinek egy részét ma már képtelenség rekonstruálni, ugyanis a jelenlegi számítógépek és szoftverek nem tudják elolvasni az alig három évtizeddel ezelőtt rögzített adatokat. Az ok úgyszólván triviális: a kutatások finanszírozói sosem költöttek a hosszú távú adattárolásra, támogatás híján pedig maguk a kutatók sem foglalkoztak a kérdéssel. A helyzet mára odáig fajult, hogy a 20. század második felének nagy tudományos adattárai nagyobb veszélyben vannak, mint annak idején az ókori világ cellulózalapú, sérülékenynek gondolt tudástárai. A papirusztekercsekre rögzített információk akár egy évezredet is gond nélkül átvészelnek, a papírra írt szöveg néhány száz éven keresztül biztosan olvasható marad, és még a magnókazetta is kihúz harminc évet – ezzel szemben a CD-k és a DVD-k legfeljebb 20 évig élnek, a merevlemezre másolt adatok átlagos túlélési ideje pedig alig éri el a 8 évet. De hasonló a helyzet a filmek világában is: a celluloid filmszalag akár 100 évig is használható marad, amit a DVD meg sem tud közelíteni.
A tisztánlátásért
Az Európai Tudományos Alapítvány szerint a felhalmozott tudományos adatok megmentésének és hozzáférhetővé tételének a támogatások során elsőbbséget kellene élveznie, még az új kutatásokkal szemben is. Nincs értelme közpénzekből kutatásokat finanszírozni, ha az eredmények felhasználhatósága az adatvesztés miatt nem biztosítható. Műhibaperekben, környezet- egészségügyi vizsgálatoknál, de a társadalomtudományokban és a részecskefizikában egyaránt perdöntő lehet a több évtizede gyűjtött adatok értékelése – ez segíthet tisztázni az előző tudósgenerációk tévedéseit, és hozhat olyan új eredményeket, amelyeket a kutatók annak idején elszalasztottak. De minderre csak akkor lesz mód, ha garantálni lehet, hogy a több évtizedes adat ma is olvasható és értelmezhető legyen.
Gigantikus mennyiség
A svájci CERN-ben, a legnagyobb európai részecskegyorsítóban egy idén májusban induló kutatási projekt a 15 évesre tervezett élettartama alatt 640 millió CD-nyi adatot generál majd a részecskeütközések eredményeiről. A közreműködő kutatóknak azonban fogalmuk sincs arról, hogyan őrzik meg ezt az adatmennyiséget a jövő számára. És ha a nyers adat valamilyen új technológia révén meg is marad, önmagában, a háttér-információk nélkül értelmét veszti. Az említett projekt 6,5 milliárd dolláros költségvetéséből mindössze 90 milliót szánnak az adatok konzerválására, de ebből csak a puszta tárolás oldható meg, és az is csak a 2023- ig tervezett nagyszabású kísérletsorozat végéig – hogy utána mi történik a gigantikus információtömeggel, azt ma még senki sem tudja.
Megoldatlan probléma
Ami a lehetséges tárolási technológiákat illeti, a mai digitális adattárolók döntően mágneses vagy optikai elvűek, s esetükben sem az adathordozó, sem a rögzítés módja nem örök időkre szól. Megoldatlan probléma továbbá, hogy hogyan lehet nagy tömegű adatbázisokat egyik adathordozó-típusról a másikra (például mikrofilmről merevlemezre) torzulás- és adatvesztés-mentesen konvertálni. Adattárként szóba jöhetne az internet is, pontosabban a világháló tárhelyei és a keresőprogramok kiszolgáló szerverei. Ezek azonban még nem működnek elég ideje ahhoz, hogy tudni lehessen, mennyire lesznek használhatóak a mai adatok tekintetében 2-3 évtized múltán. És nem is ez a feladatuk: a Google esetében például az adatok frissessége az egyik legfontosabb kritérium a találatok sorbarendezésénél – az idejétmúlt információkat, törölt oldalakat a kereső legfeljebb tárolja (egy darabig), de nem könnyen hozza elő. Ráadásul végső soron itt is mágneses lemezeken (a szerverek winchestereiben) pihennek az információk.
A manipuláció esélye
A hosszú távú adatmegőrzés igénye ugyanakkor egy másik dilemmát is felvet: ha a tudományos információk biztonságos tárolása és hozzáférhetővé tétele egyszer valóban megoldódik, akkor gondoskodni kell az adatokhoz tartozó magánszemélyek személyiségi jogainak az eddiginél hatékonyabb védelméről is. Ez különösen az egészségügyi kutatások során keletkező adatokra igaz, hiszen itt szinte mindig emberek a kutatás alanyai. Ráadásul a könnyen hozzáférhető tényeket manipulálni is egyszerűen lehet, vagyis a hozzáférés és a biztonság igénye akár összeütközésbe is kerülhet egymással.
A teljes cikket csak regisztrált felhasználóink olvashatják. Kérjük jelentkezzen be az oldalra vagy regisztráljon!