Már ChatGPT-vel is diagnosztizálhatunk egyes bőrproblémákat?

A két legismertebb mesterségesintelligencia-alkalmazás bőrbetegségek felismerése terén nyújtott teljesítményét mérték fel a Semmelweis Egyetem kutatói. Mutatjuk, hogyan teljesített az MI.

A GPT-4o az esetek 93 százalékában azonosította az aknét és a rosaceát, szemben a Google Gemini Flash 2.0-s modelljével, amely az esetek mindössze 21 százalékában ismerte fel a kórképeket – derült ki a Semmelweis Egyetem új klinikai kutatásából. A kutatók véleménye szerint a mesterséges intelligencia hosszú távon csökkentheti az időt, amíg a beteg ellátáshoz jut, ezzel pedig segíthet megelőzni az állapot rosszabbodását. A végleges diagnózis felállítása azonban továbbra is szakorvosi feladat marad – hangsúlyozták a szerzők.

bőrproblémák vizsgálata tükörben
A mesterségesintelligencia-alkalmazás 93 százalékos pontossággal azonosítja be a kórképeket. Fotó: Getty Images

A nagy kérdés: „mi lehet a legvalószínűbb diagnózis?”

A kutatók olyan betegek fotóit mutatták meg a két mesterségesintelligencia-modellnek, akiknél szakorvosi diagnózis igazolta az akné vagy a rosacea fennállását. A fotók feltöltése után az MI-modellektől azt kérdezték: „Mi lehet a legvalószínűbb diagnózis?”, úgy fogalmazva, mintha a kérdés egy laikus felhasználótól érkezne. Helyes válasz esetén a modelleknek a bőrbetegség altípusát is meg kellett nevezniük. A vizsgálatban nemzetközi bőrgyógyász szakértők is részt vettek, köztük a Yale Egyetem elismert mesterségesintelligencia-kutatója.

Az akné és a rosacea rendkívül gyakori bőrproblémák, amelyek jelentősen ronthatják az életminőséget. Diagnosztizálásuk azonban nem mindig egyszerű, mivel a tüneteik sokszor hasonlóak”

– hangsúlyozta dr. Kiss Norbert, a Semmelweis Egyetem Bőr-, Nemikórtani és Bőronkológiai Klinikájának adjunktusa, a tanulmány levelező szerzője.

„Minket is meglepett, mennyire jól teljesített a ChatGPT”

A tudósok azt látták, hogy a GPT-4o 100 százalékban adott betegségmeghatározást, és 93 százalékos pontossággal azonosította be a kórképeket. Egészen pontosan az akné esetében 91 százalékos, a rosaceával kapcsolatban pedig 100 százalékos találati arányt ért el, és más betegségeket szinte soha nem kevert össze ezekkel. Az altípusok meghatározása azonban már komolyabb kihívást jelentett a rendszernek: az akné altípusait az 55, a rosacea altípusait pedig 50 százalékban találta el helyesen. Ezzel szemben a Gemini Flash 2.0 a páciensek kevesebb mint negyedénél (21%) ismerte fel a kórképeket, így a kutatók ennél a modellnél nem végeztek további statisztikai értékelést.

Minket is meglepett, mennyire jól teljesített a ChatGPT. A betegek sokszor szkeptikusak az MI használatát illetően, és az orvosok sem mindig bíznak ezekben az eszközökben. Ezért is tartottuk fontosnak, hogy tudományos vizsgálatban mérjük fel, valójában mire képesek” – mondta dr. Kiss Norbert.

A szakértők ugyanakkor kiemelték, hogy nagyon fontos, hogy a páciensek tisztában legyenek a rendszer korlátaival, amikor mesterségesintelligencia-alkalmazással végeznek önellenőrzést. „A végleges diagnózis felállítása és a vényköteles gyógyszerek felírása továbbra is a bőrgyógyász szakorvos feladata marad” – emelte ki dr. Bánvölgyi András, a Semmelweis Egyetem Bőr-, Nemikórtani és Bőronkológiai Klinika Általános és Teledermatológiai Ambulancia vezetője.

ITT MEGOSZTHATOD:

Ajánlott videó

Heti top cikkek

Mindenki ezt issza télen, pedig többet árt vele, mint használ
életmentés
Mentőorvos: „Rendőrségi bejelentést tettem a Határ úti esettel kapcsolatban”
alacsony vércukorszint
Jelek, hogy bezuhan a vércukorszint éjszaka – Még reggel is lehet érezni
Két tabutéma, amelyet sose hozz fel a párod előtt
teszt
Mennyi a normál nyugalmi pulzus, és mikor a legjobb megmérni?
Orvosmeteorológia
Fronthatás: Nincs front
Maximum: +3 °C
Minimum: +1 °C

Túlnyomóan borult, párás, foltokban tartósan ködös idő várható. Szitálás helyenként előfordulhat. A légmozgás gyenge vagy mérsékelt lesz.A csúcsérték 2 és 6 fok között változik. Ma frontmentes idő várható, megpihenhet tehát a frontérzékenyek szervezete.

Partnerünk a

Töltsd ki kvízünket!

teszt
Tényleg pótolható a heti alváshiány a hétvégi lustálkodással?

Tudod, hogyan hat az alvásodra a koffein, a késői vacsora vagy a sok képernyőzés? Teszteld tudásodat!

teszt
Mennyi a normál nyugalmi pulzus, és mikor a legjobb megmérni?

A pulzusszám azt mutatja meg, hogy egy perc alatt mennyit ver a szív. Ez az érték kortól és egészségi állapottól függően változhat, nem árt azonban tisztában lenni néhány általános információval a pulzus tekintetében. Most letesztelheted, mennyit tudsz róla!