Valószínűség és meggyőződés (1. rész)
2007. július 01. 00:00
Többször említettük már sorozatunkban (A statisztikai megbízhatóság Medical Tribune 2005/11. szám, 15. oldal; A hamis esélyhányados és a sánta kutya, 2006/15–16. szám, 20. oldal), hogy létezik a „klasszikus” statisztikának egy „rivális” irányzata, a Bayes tételén alapuló, ún. bayesiánus iskola. Tulajdonképpen a „klasszikus” jelző itt nem jogos abban az értelemben, hogy a másik irányzat épp olyan régi múltra tekinthet vissza és alkalmazási köre is legalább ugyanolyan széles. Helyesebb lenne talán „többségi” statisztikának nevezni a frekventista következtetési módszert, amely a populáció jellemzőit rögzített, változatlan értékeknek tekinti (szemben a bayesiánusokkal, akik szerint ezek a jellemzők is valamilyen valószínűségi eloszlást követnek). Kétségtelen, hogy a frekventisták vannak többen a biostatisztikusok között, és a klinikai vizsgálatok értékelésének jelenleg hatályos szabályozása csak futólag említi, hogy bizonyos esetekben – kellőképpen megindokolva
– a Bayes-módszer is alkalmazható. Egyébként Bayes tételét a frekventisták is alkalmazzák, csak ritkábban, mint a bayesiánusok.
Thomas Bayes nonkonformista presbiteriánus lelkész egykor megpróbálta számszerűsíteni a hitet, a meggyőződés fokát. Filozófiája alapjául egy egyszerű valószínűség- számítási egyenlet szolgált (ez a Bayes-tétel), amely összefüggést teremt két esemény valószínűsége és azok feltételes valószínűségei közt. Az elméletét ismertető tanulmányt (Essay Towards Solving a Problem in the Doctrine of Chances, 1763) barátja közölte két évvel a szerző halála után.
Ebben az elméletben a megfigyelt események valószínűsége (relatív gyakorisága) még nem a végeredmény (mint a frekventista szemléletmódban), hanem csak annyiban számít, amennyiben korábbi meggyőződésünket erősíti vagy gyengíti. Ha korábbi meggyőződésünk erős volt, egyetlen – ellenkező előjelű – kísérleti eredmény nehezen billenti át a túloldalra. Ha viszont valamely kísérlet eredménye egybecseng korábbi elképzeléseinkkel, nagyon megerősödhet az azokba vetett hitünk.
Egyszerű példaként nézzünk meg egy bírósági tárgyalást, ahol az egyetlen tárgyi bizonyíték a DNS-minta. Legyen az A esemény az, hogy a gyanúsított bűnös, B pedig az, hogy a helyszínen talált DNS-minta egyezik a gyanúsítottéval. Tételezzük fel, hogy a bíró kb. 10 százalékos valószínűséggel tartja bűnösnek a gyanúsítottat, mielőtt a DNSvizsgálat eredményét megtudná (Bayes-nyelven ez az A esemény a priori valószínűsége). Ha valóban a gyanúsított a bűnös, akkor a DNS-minta egyezése biztos, tehát valószínűsége 1 (ez a B esemény valószínűsége akkor, ha A már bekövetkezett, ezt hívják feltételes valószínűségnek). Annak valószínűsége, hogy a teljes populációból véletlenszerűen kiválasztott személy DNS-mintája egyezést mutasson a helyszínen találttal, egy az egymillióhoz. A DNS-minta egyezése két, egymást kizáró esemény egyikeként következhet be: vagy akkor, ha a gyanúsított a bűnös (ennek valószínűsége 0,131), vagy ha nem ő a bűnös (ennek 0,9310–6 a valószínűsége). Mivel egymást kizáró eseményekről van szó, a valószínűségeket összeadhatjuk, tehát a DNS-minta egyezésének valószínűsége összesen 0,1000009. Itt következik a Bayes-tétel, amely azt mondja, hogy a gyanúsított bűnösségének a DNS-vizsgálat utáni, ún. a posteriori valószínűsége (az A esemény B-re kondicionált feltételes valószínűsége) kiszámítható úgy, mint az A esemény (feltétel nélküli) valószínűségének és B feltételes valószínűségének szorzata osztva B (feltétel nélküli) valószínűségével. Behelyettesítve példánk számadatait, a DNS-minta egyezése után a bűnösség valószínűsége az eredeti 0,1-ről 0,1/0,1000009=0,999991-re nő.
Az a posteriori valószínűséget tehát nem kizárólag a relatív gyakoriságok befolyásolják (jelen esetben az, hogy a DNS-minta véletlenszerű egyezése ritka, valószínűsége 10–6), hanem a bíró vagy az esküdtek a priori meggyőződése is. Ha például a bíró úgy vélné, hogy a gyanúsítottat ártatlanul vádolják, ellene hamis bizonyítékokat gyártottak (tehát a bűnösség a priori valószínűségét kb. 10–6-ra tenné), akkor az előző számítás eredménye 0,000001/ 0,0000019, azaz 0,526 lenne, jóval kisebb, mint az előző esetben.
– a Bayes-módszer is alkalmazható. Egyébként Bayes tételét a frekventisták is alkalmazzák, csak ritkábban, mint a bayesiánusok.
Thomas Bayes nonkonformista presbiteriánus lelkész egykor megpróbálta számszerűsíteni a hitet, a meggyőződés fokát. Filozófiája alapjául egy egyszerű valószínűség- számítási egyenlet szolgált (ez a Bayes-tétel), amely összefüggést teremt két esemény valószínűsége és azok feltételes valószínűségei közt. Az elméletét ismertető tanulmányt (Essay Towards Solving a Problem in the Doctrine of Chances, 1763) barátja közölte két évvel a szerző halála után.
Ebben az elméletben a megfigyelt események valószínűsége (relatív gyakorisága) még nem a végeredmény (mint a frekventista szemléletmódban), hanem csak annyiban számít, amennyiben korábbi meggyőződésünket erősíti vagy gyengíti. Ha korábbi meggyőződésünk erős volt, egyetlen – ellenkező előjelű – kísérleti eredmény nehezen billenti át a túloldalra. Ha viszont valamely kísérlet eredménye egybecseng korábbi elképzeléseinkkel, nagyon megerősödhet az azokba vetett hitünk.
Egyszerű példaként nézzünk meg egy bírósági tárgyalást, ahol az egyetlen tárgyi bizonyíték a DNS-minta. Legyen az A esemény az, hogy a gyanúsított bűnös, B pedig az, hogy a helyszínen talált DNS-minta egyezik a gyanúsítottéval. Tételezzük fel, hogy a bíró kb. 10 százalékos valószínűséggel tartja bűnösnek a gyanúsítottat, mielőtt a DNSvizsgálat eredményét megtudná (Bayes-nyelven ez az A esemény a priori valószínűsége). Ha valóban a gyanúsított a bűnös, akkor a DNS-minta egyezése biztos, tehát valószínűsége 1 (ez a B esemény valószínűsége akkor, ha A már bekövetkezett, ezt hívják feltételes valószínűségnek). Annak valószínűsége, hogy a teljes populációból véletlenszerűen kiválasztott személy DNS-mintája egyezést mutasson a helyszínen találttal, egy az egymillióhoz. A DNS-minta egyezése két, egymást kizáró esemény egyikeként következhet be: vagy akkor, ha a gyanúsított a bűnös (ennek valószínűsége 0,131), vagy ha nem ő a bűnös (ennek 0,9310–6 a valószínűsége). Mivel egymást kizáró eseményekről van szó, a valószínűségeket összeadhatjuk, tehát a DNS-minta egyezésének valószínűsége összesen 0,1000009. Itt következik a Bayes-tétel, amely azt mondja, hogy a gyanúsított bűnösségének a DNS-vizsgálat utáni, ún. a posteriori valószínűsége (az A esemény B-re kondicionált feltételes valószínűsége) kiszámítható úgy, mint az A esemény (feltétel nélküli) valószínűségének és B feltételes valószínűségének szorzata osztva B (feltétel nélküli) valószínűségével. Behelyettesítve példánk számadatait, a DNS-minta egyezése után a bűnösség valószínűsége az eredeti 0,1-ről 0,1/0,1000009=0,999991-re nő.
Az a posteriori valószínűséget tehát nem kizárólag a relatív gyakoriságok befolyásolják (jelen esetben az, hogy a DNS-minta véletlenszerű egyezése ritka, valószínűsége 10–6), hanem a bíró vagy az esküdtek a priori meggyőződése is. Ha például a bíró úgy vélné, hogy a gyanúsítottat ártatlanul vádolják, ellene hamis bizonyítékokat gyártottak (tehát a bűnösség a priori valószínűségét kb. 10–6-ra tenné), akkor az előző számítás eredménye 0,000001/ 0,0000019, azaz 0,526 lenne, jóval kisebb, mint az előző esetben.
A teljes cikket csak regisztrált felhasználóink olvashatják. Kérjük jelentkezzen be az oldalra vagy regisztráljon!