A hamis esélyhányados és a sánta kutya
2006. december 01. 00:00
A kérdés az, hogy melyiket lehet hamarabb utolérni. Egyelőre úgy tűnik, hogy az előbbit. A hibás esélyhányados kényelmesen üldögélve, zsebszámológéppel is elkapható, az elemiben tanult számtani alapműveletekkel.
Az ötlet Peter Lee-től származik (Statistics in Medicine 1999;18: 1973–1981), aki – dohányipari cégek biostatisztikus tanácsadójaként – megelégelte, hogy a cigaretta ártalmairól (amelyeknek tényét egyébként nem vonja kétségbe) boldog-boldogtalan cikket ír és gyanús statisztikákat közöl. Olyan feltételeket ellenőrzött, amelyeket feltehetőleg épp egyszerűségük miatt nem vizsgált korábban senki.
Ha például az esélyhányados vagy a relatív kockázat becslését konfidenciaintervallumal együtt közlik, akkor – helyes számolás esetén – a becsült érték a megbízhatósági határok mértani középarányosa. A következő, alig bonyolultabb feltétel, hogy a mintaelemszámnak összhangban kell lennie a konfidenciaintervallum hosszával (N>=245,86/Q2, ahol Q a logaritmált konfidenciahatárok közti különbség). A harmadik, hogy abban a 22-es táblázatban, melyből a relatív kockázatot számolják, minden egyes cellában 15,4/Q2-nél nagyobb esetszámnak kell lennie.
A Lee által ellenőrzött cikkek egyike szerint például a passzív dohányzás statisztikailag szignifikánsan növeli a tüdőrák kockázatát, már napi 1–9 cigaretta elszívása esetén a relatív kockázat 1,40- szeres (1,12; 1,76) a nemdohányzókhoz képest. Az első próbán még átmegy ez az eredmény, mert 1,402 közel egyenlő 1,12 x 1,76, de a másodikon már megbukik, mert Q2=0,204, amiből N>=1204 következne, márpedig a vizsgálatban összesen 147 ember vett részt, és közülük se szívott el mindenki napi 1–9 cigarettát, tehát a valódi mintaelemszám 147-nél kisebb. A harmadik próbát nem lehetett elvégezni az adatokon, mert az esetszámot nem közölték cellánként. A 147 és 1204 közti különbséget azonban aligha lehet kerekítési hibával magyarázni – ezt még Münchhausen báró (aki egy biostatisztikai módszer ihletője is volt, de ez külön cikket érdemel) is túlzásnak tartaná.
Lee cikkének megjelenése után sorozatban buktak le a 2 x 2-es táblazatokon, azaz bináris adatokon (a bináris adatokról részletesebben sorozatunk 18. része szólt; Fekete-fehér, igen-nem – mit számolnál szívesen? 2006/5. szám, március 16.) alapuló metaanalízisek.
Más típusú, például normális eloszlású adatokon sajnos nem lehet hasonlóan egyszerű ellenőrző képleteket kitalálni, mert az adatok szórása nem függ az átlagtól. Annyi ebben az esetben is igaz, hogy az átlag számtani középarányosa a konfidenciaintervallum végpontjainak. És N>=16.S2/Q2, ha S az adatok szórása, Q pedig a konfidenciahatárok közti különbség.
Vajon hány elemzés találtatna könnyűnek, ha a megméretésnek a fentihez hasonló eszköze mindenki számára hozzáférhető lenne? Komoly előadásokon egymással versengenének a gyorsan számoló hallgatók, melyikük kiabálja be hamarabb, hogy semmi nem igaz az egészből.
És mi ebből a tanulság? Netán az, hogy a szerzők minél kevesebb adatot közöljenek, megelőzendő az ilyen kínos lelepleződéseket? Vagy kerüljék a bináris adatokat, mert azokon könnyebb felfedezni az esetleges ellentmondásokat? Talán egyszerűbb megoldás, ha gondosan ellenőrzik adataikat közlés előtt, és nem hagyják, hogy érzelmeik és meggyőződéseik befolyásolják őket eredményeik „kerekítésében”.
Ha mégis be szeretnék építeni meggyőződéseiket az elemzésbe, ezt megtehetik, élve Bayes módszerével, amelynek épp az a lényege, hogy az eredmények kiszámításakor figyelembe veszi az előzetes elképzeléseket is. Tisztességes, követhető módon.
Az ötlet Peter Lee-től származik (Statistics in Medicine 1999;18: 1973–1981), aki – dohányipari cégek biostatisztikus tanácsadójaként – megelégelte, hogy a cigaretta ártalmairól (amelyeknek tényét egyébként nem vonja kétségbe) boldog-boldogtalan cikket ír és gyanús statisztikákat közöl. Olyan feltételeket ellenőrzött, amelyeket feltehetőleg épp egyszerűségük miatt nem vizsgált korábban senki.
Ha például az esélyhányados vagy a relatív kockázat becslését konfidenciaintervallumal együtt közlik, akkor – helyes számolás esetén – a becsült érték a megbízhatósági határok mértani középarányosa. A következő, alig bonyolultabb feltétel, hogy a mintaelemszámnak összhangban kell lennie a konfidenciaintervallum hosszával (N>=245,86/Q2, ahol Q a logaritmált konfidenciahatárok közti különbség). A harmadik, hogy abban a 22-es táblázatban, melyből a relatív kockázatot számolják, minden egyes cellában 15,4/Q2-nél nagyobb esetszámnak kell lennie.
A Lee által ellenőrzött cikkek egyike szerint például a passzív dohányzás statisztikailag szignifikánsan növeli a tüdőrák kockázatát, már napi 1–9 cigaretta elszívása esetén a relatív kockázat 1,40- szeres (1,12; 1,76) a nemdohányzókhoz képest. Az első próbán még átmegy ez az eredmény, mert 1,402 közel egyenlő 1,12 x 1,76, de a másodikon már megbukik, mert Q2=0,204, amiből N>=1204 következne, márpedig a vizsgálatban összesen 147 ember vett részt, és közülük se szívott el mindenki napi 1–9 cigarettát, tehát a valódi mintaelemszám 147-nél kisebb. A harmadik próbát nem lehetett elvégezni az adatokon, mert az esetszámot nem közölték cellánként. A 147 és 1204 közti különbséget azonban aligha lehet kerekítési hibával magyarázni – ezt még Münchhausen báró (aki egy biostatisztikai módszer ihletője is volt, de ez külön cikket érdemel) is túlzásnak tartaná.
Lee cikkének megjelenése után sorozatban buktak le a 2 x 2-es táblazatokon, azaz bináris adatokon (a bináris adatokról részletesebben sorozatunk 18. része szólt; Fekete-fehér, igen-nem – mit számolnál szívesen? 2006/5. szám, március 16.) alapuló metaanalízisek.
Más típusú, például normális eloszlású adatokon sajnos nem lehet hasonlóan egyszerű ellenőrző képleteket kitalálni, mert az adatok szórása nem függ az átlagtól. Annyi ebben az esetben is igaz, hogy az átlag számtani középarányosa a konfidenciaintervallum végpontjainak. És N>=16.S2/Q2, ha S az adatok szórása, Q pedig a konfidenciahatárok közti különbség.
Vajon hány elemzés találtatna könnyűnek, ha a megméretésnek a fentihez hasonló eszköze mindenki számára hozzáférhető lenne? Komoly előadásokon egymással versengenének a gyorsan számoló hallgatók, melyikük kiabálja be hamarabb, hogy semmi nem igaz az egészből.
És mi ebből a tanulság? Netán az, hogy a szerzők minél kevesebb adatot közöljenek, megelőzendő az ilyen kínos lelepleződéseket? Vagy kerüljék a bináris adatokat, mert azokon könnyebb felfedezni az esetleges ellentmondásokat? Talán egyszerűbb megoldás, ha gondosan ellenőrzik adataikat közlés előtt, és nem hagyják, hogy érzelmeik és meggyőződéseik befolyásolják őket eredményeik „kerekítésében”.
Ha mégis be szeretnék építeni meggyőződéseiket az elemzésbe, ezt megtehetik, élve Bayes módszerével, amelynek épp az a lényege, hogy az eredmények kiszámításakor figyelembe veszi az előzetes elképzeléseket is. Tisztességes, követhető módon.
A teljes cikket csak regisztrált felhasználóink olvashatják. Kérjük jelentkezzen be az oldalra vagy regisztráljon!