Rovatok:    Rovatok >  tudomány >  Biostatisztika

4. A biostatisztika egy alkalmazott matematikus szemével

Megérti-e egymást az orvos és a matematikus? A kutató orvos gyakran szembesül azzal a problémával, hogy mérési adatait milyen módon összesítse, azok alapján milyen következtetéseket vonhat le a vizsgált jelenségre vonatkozóan. Ehhez a biostatisztika eszköztárát kell igénybe vennie.

Mi is az a biostatisztika? A korábban biometriának nevezett tudomány a matematikai statisztika alkalmazása biológiai, orvosi, gyógyszerészeti kutatás során keletkezett adatokra. Alapja a valószínűségszámítás, módszerei pedig a kísérlettől vagy a problémától függően lehetnek többé vagy kevésbé bonyolultak.

Minden kutatónak értenie kell valamennyire a biostatisztikához, ha a kutatási ereményeit közölni szeretné. Épp itt kezdődik a probléma: a szaklapok – különösen a sokat idézett neves folyóiratok – egyre kifinomultabb statisztikai elemzést várnak el a cikkekben. Egyre kevésbé várható el, hogy a szakmáját kiválóan művelő orvos a statisztikai módszereket is naprakészen, teljes mélységükben ismerje.

Két konkrét esetet mondanék el, amely igen tanulságos volt mind a kutató orvos, mind pedig a biostatisztikus számára. Ezekben az a közös, hogy a valamelyik külföldi neves szaklapba küldött cikkben az alkalmazott statisztikai módszereket nem fogadta el a bíráló, miközben a cikk egyéb tartalmi vonatkozásait viszont elismerte. Tehát a bírálat lényegében kizárólag a statisztikai módszerekre vonatkozott.

Az egyik esetben a kísérlet a következő volt: kísérleti állatokon a beavatkozás előtt és utána több időpontban mérték kísérleti állatok bizonyos (folytonos) paramétereit, mindezt 4 csoportban. Az orvos – követve az igen neves szaklapokban található módszertant, a csoportokat minden egyes időpontban összehasonlította. Mivel több csoportról volt szó, szerencsére nem t-próbákkal végezte ezt az összehasonlítást, hanem egyszempontos varianciaanalízissel (ismert, hogy több csoport esetén helytelen páronként t-próbákat alkalmazni). Ezzel azonban nem vette figyelembe, hogy minden mérés ugyanazokon az egyedeken történt, nem vette figyelembe az időbeli változást. A megfelelő módszer ilyen esetben ismételt méréses varianciaanalízis lehet, ahol nem csak a csoportok közötti különbséget lehet vizsgálni, hanem az ismétlés (ugyanazokon az egyedeken történő ismételt mérések) hatását, sőt, azt is vizsgálni lehet, hogy az egyes csoportokban az „idő-görbe” lefutása azonos-e.

Hogy-hogy? – kérdezhetné valaki. Ami jó volt eddig, az most már nem jó? A helyzet az, hogy korábban sem volt megfelelő az egyes időpontokban egymástól függetlenül alkalmazott összehasonlítás, eddig sem volt helyes sok-sok csoport összehasonlítása páronként t-próbákkal – csak vagy a bíráló maga sem volt eléggé képzett, vagy a biostatisztikai tudás nem ment át az orvosi tudásba.

Többszempontos, ismételt méréses ANOVA-t alkalmazva az analízis az eredményeket kissé megváltoztatta ugyan, egyes „szignifikanciák” eltűntek, mások megjelentek, de az alkalmazott statisztikai modellel az összefüggések egyértelműen látszottak, a módszer segített a jelenség teljes megértésében.

A másik példa genetikai: sok tényező, közöttük egyes gének jelenlétét és hatását vizsgálták egy bizonyos betegségben és egy kontrollcsoportban. A statisztikai analízis az eredeti cikkben mindössze úgynevezett egyváltozós módszerekből állt: az átlagok összehasonlítására t-próbát, a gyakoriságok összehasonlítására khi-négyzet próbát alkalmazva. A bíráló nem találta megfelelőnek ezt az analízist, és többváltozós módszerek alkalmazását várta el a cikkben. A bírálónak igaza volt, ugyanis az egyváltozós módszerek külön-külön nem veszik figyelembe azt a tényt, hogy a tényezőket ugyanazokon az embereken mérték, így ezek óhatatlanul összefüggnek, korrelálnak. Ezen kívül itt is előfordulhat, hogy az ún. első fajta hiba megnő: tévesen ítélünk szignifikánsan különbözőnek valójában azonos populációkat. A többváltozós módszerek alkalmazásával a fenti problémák megoldódnak, pl. egy logisztikus regressziós modellel meg lehet vizsgálni, hogy egy adott betegség valószínűsége mely tényezőktől függ, vagy mely tényezők együttes jelenlététől függ. Ebben a modellben a tényezők egymás közti korrelációját is figyelembe lehet venni.

Az említett két példa mutatja az orvos-biostatisztikus párbeszéd szükségességét.

Érdekesség: A publikációs torzítás és Sherlock Holmes

Singer Júlia