A ChatGPT szinte hibátlanul felismeri a leggyakoribb bőrproblémákat
Bőrbetegségek felismerésében tesztelték a két legismertebb mesterségesintelligencia-alkalmazást a Semmelweis Egyetem kutatói.
A GPT-4o az esetek 93 százalékában azonosította az aknét és a rosaceát, szemben a Google Gemini Flash 2.0-s modelljével, amely az esetek mindössze 21 százalékában ismerte fel a kórképeket – derül ki az egyetem új klinikai kutatásából.
A MI hosszú távon csökkentheti az időt, amíg a beteg ellátáshoz jut, de a végleges diagnózis felállítása szakorvosi feladat marad, hangsúlyozzák a szerzők. A vizsgálat során a két mesterségesintelligencia-modellnek olyan betegek fotóit mutatták meg, akiknél szakorvosi diagnózis igazolta az akne vagy a rosacea meglétét. A képeket ezt megelőzően két bőrgyógyász értékelte ki egymástól függetlenül, egy harmadik szakértő bevonásával, aki eltérő diagnózis esetén döntött. A végső diagnózist többségi vélemény alapján állapították meg.
Az akne és a rosacea rendkívül gyakori bőrproblémák, amelyek jelentősen ronthatják az életminőséget. Diagnosztizálásuk azonban nem mindig egyszerű, mivel a tüneteik sokszor hasonlóak – hangsúlyozza Kiss Norbert, a Semmelweis Egyetem Bőr-, Nemikórtani és Bőronkológiai Klinikájának adjunktusa, a tanulmány levelező szerzője.
A fotók feltöltése után az MI-modellektől azt kérdezték: „Mi lehet a legvalószínűbb diagnózis?”, úgy fogalmazva, mintha a kérdés laikus felhasználótól érkezne. Helyes válasz esetén a modelleknek a bőrbetegség altípusát is meg kellett nevezniük.
A vizsgálatban nemzetközi bőrgyógyász szakértők is részt vettek, köztük a Yale Egyetem elismert mesterségesintelligencia-kutatója. A GPT-4o 100 százalékban adott betegségmeghatározást; 93 százalékos pontossággal azonosította be a kórképeket. Akne esetében 91 százalékos, rosaceánál 100 százalékos találati arányt ért el, más betegségeket szinte soha nem kevert össze ezekkel.
Az altípusok meghatározása azonban már komolyabb kihívást jelentett a rendszernek az akne altípusait 55 százalékban, a rosacea altípusait pedig 50 százalékban találta el helyesen. Ezzel szemben a Gemini Flash 2.0 a páciensek kevesebb mint negyedénél (21%) ismerte fel a kórképeket, így a kutatók ennél a modellnél nem végeztek további statisztikai értékelést.
Minket is meglepett, mennyire jól teljesített a ChatGPT – mondta Kiss Norbert. – A betegek sokszor szkeptikusak az MI használatát illetően, és az orvosok sem mindig bíznak ezekben az eszközökben. Ezért is tartottuk fontosnak, hogy tudományos vizsgálatban mérjük fel, valójában mire képesek.
A kutatás rámutat, hogy miközben világszerte nő az igény bőrgyógyászati ellátásra, a szakorvosok száma korlátozott – az Egyesült Királyságban 100 ezer lakosra 1, Görögországban 11,4 bőrgyógyász jut.
A szerzők szerint az MI hosszú távon csökkentheti azt az időt, amíg a beteg ellátáshoz jut, és segíthet megelőzni az állapot rosszabbodását.
Az olyan, mindenki számára elérhető MI-eszközök, mint a ChatGPT, egyre nagyobb szerephez jutnak a bőrgyógyászati önellenőrzésben, sőt hatással vannak arra is, hogy valaki orvoshoz fordul-e, vagy sem – mondja Mehdi Boostani, a Semmelweis Egyetem PhD-hallgatója, a tanulmány első szerzője. – Bár az általunk tesztelt modell kiválóan szerepelt az alapdiagnózis felállításában, az egyes betegségaltípusok megállapításában már kevésbé volt hatékony – teszi hozzá.
Ezért fontos, hogy a páciensek tisztában legyenek a rendszer korlátaival, amikor mesterségesintelligencia-alkalmazással végeznek önellenőrzést.
A végleges diagnózis felállítása és a vényköteles gyógyszerek felírása továbbra is a bőrgyógyász szakorvos feladata marad – emeli ki Bánvölgyi András, a Semmelweis Egyetem Bőr-, Nemikórtani és Bőronkológiai Klinika Általános és Teledermatológiai Ambulancia vezetője.
Éppen azért fontos a lakosság tájékoztatása, hogy mindenki felelős döntést tudjon hozni, amikor mesterséges intelligencia segítségével ellenőrzi a bőre állapotát – teszi hozzá Mehdi Boostani.