LOŠI SAVJETI

AI chatbotovi griješe u postavljanju dijagnoza u 80 posto slučajeva

16.04.2026 08:57 | Autor: A. S.

Freepik

AI chatbotovi su postali precizniji u dijagnostici kada dobiju puno kliničkih informacija, ali i dalje ne uspijevaju napraviti dobru diferencijalnu dijagnozu u više od 80% slučajeva, navode istraživači iz Mass General Brighama, velike bolničke i istraživačke mreže iz Bostona.

Studija objavljena u časopisu JAMA Network Open pokazala je da veliki jezični modeli (LLM) još uvijek nisu dovoljno dobri za kliničku upotrebu.

"Unatoč stalnim poboljšanjima, standardni veliki jezični modeli nisu spremni za nadziranu primjenu u kliničke svrhe", izjavio je Marc Succi, koautor studije.

Dodao je da umjetna inteligencija još ne može napraviti diferencijalnu dijagnozu, što je ključno za kliničko zaključivanje i što on naziva "umijećem medicine". Diferencijalna dijagnoza je prvi korak kojim liječnici prepoznaju bolest i razlikuju je od drugih stanja sa sličnim simptomima.

Kako su modeli testirani

Istraživači su testirali 21 model, uključujući najnovije verzije Claude, DeepSeek, Gemini, GPT i Grok. Procjena je provedena na 29 standardiziranih kliničkih slučajeva pomoću novog alata PrIME-LLM.

Ovaj alat procjenjuje koliko su modeli uspješni u različitim fazama kliničkog zaključivanja:

Postavljanje početne dijagnoze
Naručivanje odgovarajućih pretraga
Donošenje konačne dijagnoze
Planiranje liječenja

Da bi što bolje simulirali stvarne kliničke slučajeve, istraživači su modele postupno “hranili” informacijama. Prvo su im dali osnovne podatke poput dobi, spola i simptoma pacijenta, a zatim su dodali nalaze pregleda i laboratorijske rezultate.

Sve ih je više, ali oprez: Evo što morate znati o chatbotovima koji daju zdravstvene savjete

U praksi je diferencijalna dijagnoza ključna za nastavak liječenja. No, u ovoj studiji modeli su dobivali dodatne informacije kako bi mogli nastaviti dalje, čak i ako nisu uspjeli napraviti diferencijalnu dijagnozu.

Rezultati: Konačna dijagnoza vs. klinički put

Istraživači su otkrili da su jezični modeli bili vrlo točni u postavljanju konačnih dijagnoza, ali su loše radili diferencijalne dijagnoze i teško se snalazili u nejasnim situacijama.

Autorica studije Arya Rao rekla je da postupno testiranje modela omogućuje da ih ne gledamo samo kao "rješavače testova", već ih stavlja u ulogu liječnika.

"Ovi modeli su izvrsni u postavljanju konačne dijagnoze kada imaju sve podatke, ali im je teško na početku slučaja, kada informacija nema puno", dodala je.

Ključni nalazi studije:

Svi modeli podbacili su u izradi odgovarajuće diferencijalne dijagnoze u više od 80 % slučajeva.
Uspješnost kod konačne dijagnoze kretala se od 60 % do preko 90 %, ovisno o modelu.
Većina modela pokazala je bolju preciznost kada su uz tekst dobili laboratorijske nalaze i radiološke snimke.
Najbolje rezultate pokazala je skupina modela koja uključuje Grok 4, GPT-5, GPT-4.5, Claude 4.5 Opus, Gemini 3.0 Flash i Gemini 3.0 Pro.

Medicinski stručnjaci i dalje su ključni

Autori su naglasili da, iako su modeli napredovali i bolje zaključuju, standardni LLM-ovi još nisu dovoljno inteligentni za sigurnu upotrebu i ne mogu pokazati napredno kliničko razmišljanje.

"Naši rezultati potvrđuju da veliki jezični modeli u zdravstvu i dalje zahtijevaju prisutnost čovjeka i vrlo strog nadzor", istaknuo je Succi.

Susana Manso García iz Španjolskog društva za obiteljsku i komunitarnu medicinu, koja nije sudjelovala u studiji, smatra da ovi rezultati šalju jasnu poruku javnosti.

"Sama studija naglašava da se ovi modeli ne smiju koristiti za kliničke odluke bez nadzora. Iako umjetna inteligencija ima potencijal, ljudska procjena je i dalje nezamjenjiva. Preporuka je da ljudi koriste ove tehnologije oprezno i da se kod zdravstvenih problema uvijek obrate liječniku", zaključila je.

Povezane vijesti

Dramatičan pad povjerenja u zdravstveni sustav i znanstvenu zajednicu u SAD-u

Podijeli:

Više vijesti

OPREZ

Dijete se može utopiti u sekundi, i to bez ijednog glasa: Zapamtite nekoliko važnih pravila

UPOZORENJE

Zabrinjavajući podaci: Europom se širi gonoreja otporna na antibiotike, rekordne brojke oboljelih!

mjere

Bjelovar u borbi protiv manjka liječnika: Pedijatrima nude do 7.000 eura neto dodatka na plaću!

DARIVANJE KRVI

Ova krvna grupa posebno je tražena tijekom ljeta, liječnici pozivaju na darivanje

LOŠI SAVJETI

AI chatbotovi griješe u postavljanju dijagnoza u 80 posto slučajeva

Kako su modeli testirani

Rezultati: Konačna dijagnoza vs. klinički put

Medicinski stručnjaci i dalje su ključni

Povezane vijesti

Više vijesti

OPREZ

Dijete se može utopiti u sekundi, i to bez ijednog glasa: Zapamtite nekoliko važnih pravila

UPOZORENJE

Zabrinjavajući podaci: Europom se širi gonoreja otporna na antibiotike, rekordne brojke oboljelih!

mjere

Bjelovar u borbi protiv manjka liječnika: Pedijatrima nude do 7.000 eura neto dodatka na plaću!

DARIVANJE KRVI

Ova krvna grupa posebno je tražena tijekom ljeta, liječnici pozivaju na darivanje

Novosti

Uspjeh u KB Dubrava: Prvi put u Hrvatskoj izvedena rijetka i složena operacija kralježnice kroz trbuh!

rasprava u sad-u

Šef Pentagona naredio masovno testiranje vojnika na testosteron, liječnici upozoravaju: "Učinak bi mogao biti suprotan"

Više iz rubrike

PRIOPĆENJE

Novi sporazum Hrvatske i BiH omogućit će još brže hitno zbrinjavanje pacijenata iz doline Neretve

Kad odlučuju minute

Helikopter hitne pomoći postao je važna karika spašavanja života

zdravstveni sustavi

Njemačka ima privatne bolničke gigante i nema panike: Zašto model koji u Hrvatskoj izaziva strah tamo funkcionira?

NOVA OPREMA

Zadarska bolnica nabavila pet novih respiratora vrijednih više od 140 tisuća eura

NEDOSTATAK KADRA

Gotovo četvrtina zaposlenika KBC-a Split tijekom lipnja bila je na bolovanju

DOBRE VIJESTI

HZZO odobrio prvu terapiju za Duchenneovu mišićnu distrofiju: Lijek će biti dostupan od 17. srpnja

PROBLEMI

Pandemija je davno prošla, ali bitka za novac traje: Tisuće zdravstvenih radnika na sudovima traže "Covid dodatak"

zdravstveno-statistički ljetopis

Najviše pobačaja u Hrvatskoj ne rade mlade djevojke: Novi podaci ruše uobičajene zablude

MENADŽMENT

Ravnatelj KBC-a Zagreb: Nije presudno je li na čelu bolnice liječnik, već da bude stručnjak s vizijom

OTKRIĆE

Novo istraživanje mijenja dosadašnje razumijevanje rasta ljudske kose

spinalna atrofija

Genska terapija koja se prima samo jednom sada stiže i do odraslih pacijenata

projekcija proračuna

Ministarstvu zdravstva iduće godine gotovo 28 posto manje novca

Više iz kategorije: Novosti