Chatboty poznajú medicínu: Pri pacientoch však zlyhávajú

Vďaka financiám z reklamy prinášame kvalitné a objektívne informácie. Povoľte si prosím zobrazovanie reklamy na našom webe. Ďakujeme, že podporujete kvalitnú žurnalistiku.

Zdroj: Freepik.com

AI chatboty môžu pôsobiť ako rýchly lekár vo vrecku, no nová štúdia ukázala opak. Vedci zistili, že problém nie je len v odpovediach modelov, ale najmä v tom, ako s nimi ľudia pri zdravotných ťažkostiach komunikujú.

Nový výskum publikovaný v časopise Nature Medicine ukázal, že veľké jazykové modely síce zvládajú medicínske otázky na papieri veľmi dobre, no v reálnom kontakte s ľuďmi zlyhávajú. Výskumníci testovali 1 298 účastníkov vo Veľkej Británii, ktorí riešili desať bežných zdravotných scenárov. Časť z nich používala chatboty GPT-4o, Llama 3 alebo Command R+, zvyšok sa spoliehal na vlastné bežné zdroje, napríklad internetové vyhľadávanie.

Výsledok bol nepríjemný. Ľudia s pomocou chatbotov neboli lepší v rozhodovaní, kam sa majú obrátiť po pomoc, a boli dokonca menej úspešní pri určovaní správnej príčiny ťažkostí než kontrolná skupina. Samotné modely pritom pri priamom testovaní bez človeka vedeli identifikovať relevantné diagnózy v priemere v 94,9 percenta prípadov. Keď však do procesu vstúpil používateľ, úspešnosť pri určovaní relevantných stavov klesla pod 34,5 percenta a správne odporúčanie ďalšieho postupu bolo pod 44,2 percenta.

Lekári v tomto videu vysvetľujú, prečo môžu byť AI chatboty užitočné pri vysvetlení informácií, no stále nie sú náhradou za skutočné medicínske rozhodovanie. Tematicky presne dopĺňa zistenia novej štúdie:

Práve tu sa ukázal najväčší paradox. Chatboty často správnu diagnózu niekde v konverzácii spomenuli, lenže ľudia si ju nevšimli, zle si ju zapamätali alebo zadali neúplné informácie. V iných prípadoch model nesprávne pochopil dôležitý detail. Vedci preto hovoria, že nejde iba o problém medicínskej znalosti AI, ale o zlyhanie komunikácie medzi človekom a strojom.

To je dôležité aj preto, že dnešné chatboty už dokážu excelovať v medicínskych testoch a licenčných skúškach, čo môže vytvárať falošný pocit bezpečia. Autori štúdie však upozorňujú, že dobrý výsledok v benchmarkoch neznamená, že systém bude bezpečne fungovať pri skutočných pacientoch. Reálny človek opisuje príznaky nepresne, pýta sa chaoticky a ľahko zle pochopí odpoveď. Presne tam sa láme dôvera v AI medicínu.

Výskumníci preto nehovoria, že AI nemá v zdravotníctve miesto. Skôr tvrdia, že jej úloha bude zatiaľ skôr podporná než diagnostická. Môže pomáhať so sumarizáciou záznamov, návrhmi dokumentov či administratívou, no ako prvá zastávka pri zdravotných problémoch ešte pripravená nie je. A to je varovanie, ktoré prichádza presne v čase, keď sa čoraz viac ľudí pýta chatbotov na vlastné príznaky namiesto lekára.