11. A számtalan tényezőtől függő mintaelemszám
Egy kis kvíz: melyik az a két fogalom, amely sorozatunk eddigi tíz részében mindig szerepelt? A helyes válasz az első és második fajta hiba. A gyakorisági verseny harmadik helyezettje a mintaelemszám, amely szorosan összefügg a kétféle hibával.
A mintaelemszámnak egyrészt elég nagynak kell lennie ahhoz, hogy a klinikai vizsgálat eredménye és az abból levont következtetés megalapozott legyen, ugyanakkor a lehető legkisebbnek kell lennie, hogy a placebóval vagy a kevésbé hatásos készítménnyel való kezelésben ne részesüljön indokolatlanul sok beteg. Talán ezért szokták a nevét némi tisztelettel említeni – becsléséhez statisztikai tudás és jóstehetség egyaránt szükségeltetik.
A statisztikus rémálma
A klinikai vizsgálatot tervező statisztikus rémálma a p=5,1 százalékos végeredmény. Ilyenkor mindenki tervezési hibát sejt, különösképpen akkor, ha az eredmény klinikailag releváns. Lehet ugyan magyarázkodni, hogy az 5 százalékos küszöbérték teljesen önkényes – de a döntéshozatalban általában szükség van előre megszabott feltételekre. Az 5 százaléknak amúgy is igen tekintélyes múltja van (lásd keretes írásunkat). Nézzük hát, miből áll egy mintaelemszám-meghatározás, miután rögzítették az első és második fajta hibát.
A feltételek szigorítása
Az első lépés a fő hatásmutató kiválasztása. Például egy fájdalomcsökkentő szer esetében más a próba ereje, ha a fájdalmat kategóriákkal jellemezzük (nincs, enyhe, közepes, erős) vagy ún. vizuális-analóg skálán mérjük, mely azt jelenti, hogy a beteg a fájdalommal nagyjából arányos szakaszt rajzol egy tíz cm hosszú keretbe (ez folytonos változó, mert 0 és 10 cm között elvileg bármilyen értéket felvehet). És megint más, ha csak két kategóriát definiálunk: érez-e a beteg fájdalmat vagy sem. Általában folytonos változó esetén a legnagyobb a próba ereje, mert a kategóriákra való leegyszerűsítés információvesztéssel jár.
Ha már kiválasztottuk a fő hatásmutatót, akkor a következő lépésben annak eloszlásáról kell minél több információt gyűjtenünk. Ha például a már említett vizuális-analóg skálán 2 pontos átlagos fájdalomcsökkenést várunk és az értékek szórásának jósolt értéke is 2, akkor négyszer akkora mintaelemszámra van szükség, mint hogyha a szórás csak 1 lenne. Ugyancsak négyszereződik a mintaelemszám akkor is, ha 2 helyett csak 1 pontos változást várunk. A mintaelemszám tehát csökkenthető homogénebb betegcsoportok kialakításával, vagyis a vizsgálatba való beválasztás feltételeinek szigorításával. Azért élnek ezzel az eszközzel mégis óvatosan, mert a betegpopuláció szűkítése egyben azt is jelenti, hogy a vizsgálat következtetései is csak arra a szűkebb populációra lesznek érvényesek.
Az elrendezés hatása
A vizsgálati elrendezés is befolyásolja a mintaelemszámot. Általában a keresztezett elrendezésű vizsgálatok (amikor a betegek két csoportja rendre mindkét vizsgált kezelésben részesül, csak más sorrendbenl) kisebb mintaelemszámot igényelnek, mint a párhuzamos elrendezésűek. A keresztezett elrendezés alkalmazási köre viszont korlátozott (például krónikus betegségek vizsgálatakor vagy egészséges önkéntesek esetében alkalmazható, mert ott az első és második gyógyszer beszedése előtti kezdeti értékek azonosnak tekinthetőek).
A vizsgálat célja
Talán furcsa, hogy ez a pont csak most következik a sorban. Ugyanahhoz a hatásmutatóhoz és ugyanahhoz a kísérleti elrendezéshez más-más mintaelemszám tartozik aszerint, hogy a két kezelés közt különbséget vagy egyenértékűséget akarunk igazolni, vagy esetleg csak azt, hogy az egyik kezelés nem rosszabb, mint a másik.
Mindezek után következik a hatásmutató értékeléséhez szükséges – és a mintaelemszámot szintén befolyásoló – statisztikai próba kiválasztása. Ha például két fájdalomcsillapító hatását hasonlítjuk össze vizuális-analóg skálán t-próbával és Mann–Whitney-próbával, a próbák ereje nem lesz egyforma (általában a nemparaméteres próbák ereje valamivel kisebb, mint paraméteres megfelelőiknek). Tulajdonképpen minden statisztikai próbához tartozik egy mintaelemszám-meghatározási módszer, ezért aztán nagyon sok ilyen módszer létezik és körük egyre bővül.
A p=5 történeteAz 5 százalékos küszöbérték 1925-ben szinte egy időben jelent meg Ronald Fishernél (akit 1952-ben II. Erzsébet királynő lovaggá ütött) és Student-nél (eredeti nevén William Sealy Gosset-nél, aki Guiness sörgyári állása miatt kényszerült eme írói-statisztikusi álnév használatára). Egyesek szerint azért éppen 5 százalék, mert Student először erre számolta ki a t-eloszlás értékeit, s mivel egy ilyen táblázat kiszámítása a számítógép előtti időkben nagyon sokáig tartott, hosszú ideig ez maradt az egyetlen segédeszköz a t-próbához. |