Проучване, публикувано в “Бритиш медикъл джърнъл”, показва, че почти всички големи езикови модели (LLM) и чатботове показват признаци на леко когнитивно увреждане при изпълнение на тестове, които обикновено се използват за откриване на ранни признаци на деменция. Възможността за замяна на хора с изкуствен интелект в медицината беше поставена под въпрос, след като резултатите сочат, че по-старите версии на чатботовете се представят по-зле, подобно на възрастни пациенти.
Изследователите оценили когнитивните способности на водещи публично достъпни LLM като ChatGPT версии 4 и 4o, Claude 3.5 Sonnet и Gemini версии 1 и 1.5, използвайки Монреалския тест за когнитивна оценка (MoCA). Въпреки напредъка в AI, резултатите показват, че всички модели имат слаби резултати в области като визуално-пространствени умения и изпълнителни функции.
Резултатите показват, че моделите Gemini не успяват да се справят със задачата за запомняне на думи, а ChatGPT 4o постига най-висок резултат. Въпреки успешното изпълнение на много задачи, свързани с език и внимание, недостатъчната способност на чатботовете за сложни визуални интерпретации подчертава слабост в тяхната функционалност, която затруднява тяхното използване в клинични условия. Авторите заключават, че изкуственият интелект вероятно не е готов да замени лекарите и може би ще бъде използван за лечение на виртуални пациенти, които показват когнитивни нарушения.