hirdetés
hirdetés
2024. április. 16., kedd - Csongor.
hirdetés

7. A statisztikai megbízhatóság

Mint minden rendes tudományágnak, úgy a biostatisztikai gondolkodásmódnak is különböző korszakai voltak.

Az első fajta hiba gyakoriságának elsődlegessége az ún. frekventista szemléletmód alaptétele (melyben közvetve az is benne van, hogy az ismeretlen populáció jellemzőit – átlagát, szórását – a frekventisták rögzítettnek tekintik). A “rivális” filozófiai irányzat a bayesiánus, mely szerint az említett jellemzők nem kőbevésett, rögzített számok, hanem valamilyen valószínűségi eloszlást követnek és a cél ennek az eloszlásnak a minél pontosabb megközelítése. A legújabb pedig a két elmélet egyfajta ötvözete, mely a téves felfedezések arányához kapcsolódik. (A téves felfedezések arányával, az ún. érdekes P-vel már foglalkoztunk és reményeink szerint a bayesiánusok is sorra kerülnek majd rovatunkban.) Egyelőre azonban a frekventista szemléletmód uralja a gyógyszerek törzskönyvezésével kapcsolatos statisztikai területeket, egyrészt azért, mert gyorsabb és gyakorlatiasabb, másrészt azért, mert jelentős előnyre tett szert a számítógép előtti időkben.

Az első fajta hiba egyeduralma tehát egyelőre nem forog veszélyben, azonban a statisztikai elemzésnek nem egyetlen és kizárólagos célja a döntéshozatal. A különböző (beteg vagy egészséges) populációk jellemzőinek megismerése, becslése is fontos. Ahol pedig becsült értékek vannak, ott előkerül a becslés pontosságának kérdése is.

A legegyszerűbb példa a mintaátlag, minden statisztikai kézikönyv első fejezetének tárgya. Mintaátlagot számolunk, és reményeink szerint ezzel jól megközelítjük a – számunkra legtöbbször ismeretlen – populációs átlagot. Ha még egy ugyanakkora mintát veszünk ugyanabból a populációból, annak átlaga is a már említett populációs átlag egy becslése. Ha ezt a műveletet nagyon sokszor megismételjük, akkor nagyon sok – rendszerint különböző – becslésünk lesz ugyanarra a populációs átlagra vonatkozóan. Ezeknek a becsléseknek a szórását nevezzük a becslés standard hibájának. Ez az elnevezés nem csupán az átlagra, hanem minden egyéb becsült jellemzőre érvényes. Ha az előbbi ismétlés során egymáshoz közeli átlagértékeket kapunk, akkor nagyobb bizalmunk lesz a becslés eredményében, mint hogyha az átlagértékek “nagyon szétszóródnának”. A statisztikai bizalom tehát – a jelzőtlen bizalommal ellentétben – számszerűsíthető és rendszerint egyenesen arányos a becslés standard hibájával. S ha már van mértéke, akkor lehet a megbízhatóságnak alsó és felső határa is, ez a két érték határolja a – becsült értéket is magába foglaló – konfidenciaintervallumot. A 95%-os konfidenciaintervallum az a tartomány, mely 95%-os valószínűséggel tartalmazza az ismeretlen populációs jellemző (a mi példánkban az átlag) értékét.

Az eredmények interpretálásában ez az intervallum legalább annyira fontos, mint a P érték. Ha azt mondjuk, hogy egy gyógyszer szignifikánsan csökkentette a vérnyomást és a csökkenéshez tartozó P érték 0.026, ez kevés támpontot nyújt a hatás megítéléséhez. De ha még hozzátesszük, hogy a vizsgálatban mért csökkenések átlaga 28 Hgmm és az átlag 95%-os konfidenciaintervalluma 20 Hgmm-től 36 Hgmm-ig terjed, akkor ez azt jelenti, hogy a “valódi”, a teljes populációban mért átlag nagy valószínűséggel 20 és 36 között van.

Tegyük fel, hogy két gyógyszer közül az elsőnél a gyógyulási arány 82%, a 95%-os konfidenciaintervallum pedig (80%, 84%), a másiknál a gyógyulási arány 84%, míg a 95%-os konfidenciaintervallum (68%, 100%). Azt hiszem, a második gyógyszert csak az ítéli jobbnak, aki szeret kockáztatni, mert bár ott magasabb a gyógyulási arány becsült értéke, de jóval nagyobb a becslés bizonytalansága is.

A konfidenciaintervallum – mint az előző két példa mutatja – az eredmények interpretálásában szinte nélkülözhetetlen. A “szinte” szó itt csak azt jelzi, hogy az intervallum helyett néha a standard hibát közlik és olyankor abból számolható az intervallum két végpontja, de a megbízhatóság valamilyen mértékszámára mindenképpen szükség van. Enélkül a becsült érték a súlytalanság állapotában lebeg, semmit nem tudunk arról, hogy mennyire közelíti meg a “valódi” értéket.

A fenti példákban szereplő intervallumok konfidencia szintje mindkét esetben 95%, ugyanis ezt alkalmazzák a leggyakrabban. Ugyanolyan kiválasztott szerepe van, mint az 5%-os szignifikancia szintnek. Ha ugyanis az a bizonyos valódi érték 95%-os valószínűséggel az adott intervallumon belül van, akkor csupán 5% annak valószínűsége, hogy az intervallumon kívül esik. Tehát kevés (pontosabban: 5%-nál kisebb) annak valószínűsége, hogy az általunk becsült érték valódi értéke az intervallumon kívül essen. Akkor viszont a becsült eredmény az intervallumon kívüli minden értéktől 5%-os szinten szignifikánsan eltér. Az első példában a kapott 28 Hgmm-es átlag 5%-os szinten szignifikánsan eltér 15-től vagy 40-től, de nem tér el 30-tól, mert a 15- és 40-es értéket nem, viszont a 30-as értéket tartalmazza a megbízhatósági intervallum.

A megbízhatósági intervallum bizonyos értelemben tehát jóslásra is alkalmas: a populáció valamely jellemzőjének valódi értékére következtethetünk belőle. Nem alkalmas viszont egyedi értékek előrejelzésére.

(A következő részben az egyedi esetekre alkalmazható predikciós intervallumokról lesz szó.)

Singer Júlia
a szerző cikkei

(forrás: Medical Tribune)
Olvasói vélemény: 0,0 / 10
Értékelés:
A cikk értékeléséhez, kérjük először jelentkezzen be!
hirdetés