Analizom tri tisuće odgovora na pitanja o vijestima, međunarodno je istraživanje pokazalo koliko su točni odgovori najpoznatijih AI asistenata. Istraživane su softverske aplikacije koje koriste umjetnu inteligenciju za razumijevanje prirodnog jezika i obavljanje zadataka za korisnika.
Procjena je rađena na uzorku AI asistenata na 14 jezika, prema kriterijima točnosti, navođenja izvora i sposobnosti razlikovanja mišljenja od činjenica. Softverske aplikacije kojima su postavljena pitanja su, među ostalima, ChatGPT, Copilot, Gemini i Perplexity.
Ukupno je 45 posto analiziranih AI odgovora sadržavalo barem jednu ozbiljnu pogrešku, dok je 81 posto imalo neki oblik problema, pokazalo je istraživanje. Reuters je kontaktirao tvrtke uključene u istraživanje kako bi zatražio njihov komentar o rezultatima istraživanja.
Trećina odgovora ima ozbiljne greške
Gemini, Googleov AI asistent, ranije je na svojoj internetskoj stranici naveo da pozdravlja povratne informacije korisnika kako bi se platforma mogla nastaviti poboljšavati i postati korisnija.
OpenAI i Microsoft su prethodno izjavili da su takozvane “halucinacije”, situacije u kojima AI model generira netočne ili zavaravajuće informacije zbog, primjerice, nedostatka podataka, problem na kojem aktivno rade kako bi ga otklonili. Perplexity na svojoj stranici navodi da jedan od njegovih načina rada, nazvan “Deep Research”, ima točnost od 93,9 posto u pogledu činjenica. Trećina odgovora AI asistenata pokazala je ozbiljne pogreške u navođenju izvora, poput izostanka izvora, pogrešnog ili netočnog navođenja, navodi se u istraživanju.
Čak 72 posto odgovora Geminija, Googleova AI asistenta, imalo je značajne probleme s izvorima, u usporedbi s manje od 25 posto kod svih ostalih asistenata. Problemi s točnošću utvrđeni su u 20 posto svih analiziranih odgovora, uključujući slučajeve zastarjelih informacija. U studiji su navedeni i primjeri, poput onog u kojem je Gemini pogrešno naveo izmjene zakona o jednokratnim e-cigaretama te slučaj kada je ChatGPT nekoliko mjeseci nakon smrti pape Franje i dalje navodio da je on aktualni papa.

‘Ljudi ne znaju čemu mogu vjerovati’
U istraživanju su sudjelovala 22 javna medijska servisa iz 18 zemalja, među kojima su Francuska, Njemačka, Španjolska, Ukrajina, Velika Britanija i Sjedinjene Američke Države. Kako AI asistenti sve više zamjenjuju tradicionalne internetske tražilice u pristupu vijestima, javno povjerenje moglo bi biti ozbiljno narušeno, upozorio je EBU. “Kada ljudi više ne znaju čemu mogu vjerovati, na kraju ne vjeruju ničemu, a to može obeshrabriti sudjelovanje u demokratskim procesim”, izjavio je direktor EBU-a za medije Jean Philip De Tender.
Prema Digital News Reportu 2025. Reutersova instituta, oko sedam posto svih korisnika interneta koji prate vijesti i čak 15 posto onih mlađih od 25 godina koristi AI asistente za informiranje o aktualnostima. Novo izvješće poziv je AI kompanije na veću odgovornost i poboljšanje načina na koji njihovi asistenti odgovaraju na pitanja povezana s vijestima.















