Když AI vypadá chytře, ale nechápe nic
Lidé soudí inteligenci jednoduše. Podívají se na body v testech. Sledují, jak někdo řeší úkoly. Poslouchají vysvětlení. Pokud to jde dobře na různých frontách, myslíme si: Tohle chápe, co dělá. Ale u AI je to jinak. Umělá inteligence umí hrát na jistotu dokonale. Jenže často netuší, o čem mluví.
Přesně to odhalili vědci z Univerzity v Zhejiang. Prohlédli si model Centaur. Ten slavil úspěchy. Měl napodobovat lidskou mysl. Ale ukázalo se, že je to jen iluze.
Model, který sliboval zázraky
V červenci 2025 se o Centaur mluvilo všude. Vzali běžný velký jazykový model – ten typ, co pohání chatbota. Natrénovali ho na datech z psychologických testů. Výsledek? Zvládl 160 úkolů. Od rozhodování po kontrolu impulsů. Všichni se nadchli. Blížíme se k AI, která myslí jako člověk?
Pak přišel ten moment pravdy.
Test, co všechno odhalil
Výzkumníci zkusili trik. Vzali originální otázky z psychologie. Nahradili je nesmyslem. Místo "Která volba je správná strategie?" napsali jen "Vyber volbu A". Co se stalo? AI pořád vybírala "správné" odpovědi z tréninku. Ignorovala nový pokyn úplně. Jako by sledovala skrytý návod z paměti.
Představte si žáka, co si pamatuje barvu tužky učitele na starých testech. Kroužkuje odpovědi podle vzoru. Nečte otázku. Přesně tak fungoval Centaur.
Proč je to důležité – a trochu strašidelné
Toto odkrývá slabinu současných testů AI. Velké modely jsou mistři v statistice. Naučí se vzory z miliard příkladů. Ale to není chápání. Jsou jako černé skřínky. Nevidíme, jak rozhodují. Snadno si myslíme, že vzory = porozumění.
V praxi? Pokud nasadíme takovou AI, doufáme v opravdové myšlení. Ale v nových situacích splaskne. Dá špatné rady s jistotou. Halucinace, chyby v interpretaci. Nebo horší – rozhodnutí, kde jde o život.
Problém, co nikdo nevyřešil
Tady je jádro. Skutečné chápání jazyka je těžší, než jsme čekali. Zachytit úmysl otázky. Proč se ptá. To není jen o shodě vzorů v testech. Potřebujeme pochopit smysl slov v kontextu.
Není to o výkonu počítače. Ani o datech. Je to základy: co slova znamenají.
Závěr
Pád Centauru je v podstatě dobrá zpráva. Vědci se učí odhalovat podvody. Nepřijímají benchmarky naslepo. Rozlišují "dobře testováno" od "opravdu chápe".
Příště, když uslyšíte o AI průlomu, zeptejte se: Co kdybych změnil otázku? Fungovalo by to pořád?
Zdroj: ScienceDaily