← Home

AI, který prolétl testem, ale neměl tušení, o čem se ptá

2026-05-01T12:50:29.901369+00:00

Když AI vypadá chytře, ale nechápe nic

Lidé soudí inteligenci jednoduše. Podívají se na body v testech. Sledují, jak někdo řeší úkoly. Poslouchají vysvětlení. Pokud to jde dobře na různých frontách, myslíme si: Tohle chápe, co dělá. Ale u AI je to jinak. Umělá inteligence umí hrát na jistotu dokonale. Jenže často netuší, o čem mluví.

Přesně to odhalili vědci z Univerzity v Zhejiang. Prohlédli si model Centaur. Ten slavil úspěchy. Měl napodobovat lidskou mysl. Ale ukázalo se, že je to jen iluze.

Model, který sliboval zázraky

V červenci 2025 se o Centaur mluvilo všude. Vzali běžný velký jazykový model – ten typ, co pohání chatbota. Natrénovali ho na datech z psychologických testů. Výsledek? Zvládl 160 úkolů. Od rozhodování po kontrolu impulsů. Všichni se nadchli. Blížíme se k AI, která myslí jako člověk?

Pak přišel ten moment pravdy.

Test, co všechno odhalil

Výzkumníci zkusili trik. Vzali originální otázky z psychologie. Nahradili je nesmyslem. Místo "Která volba je správná strategie?" napsali jen "Vyber volbu A". Co se stalo? AI pořád vybírala "správné" odpovědi z tréninku. Ignorovala nový pokyn úplně. Jako by sledovala skrytý návod z paměti.

Představte si žáka, co si pamatuje barvu tužky učitele na starých testech. Kroužkuje odpovědi podle vzoru. Nečte otázku. Přesně tak fungoval Centaur.

Proč je to důležité – a trochu strašidelné

Toto odkrývá slabinu současných testů AI. Velké modely jsou mistři v statistice. Naučí se vzory z miliard příkladů. Ale to není chápání. Jsou jako černé skřínky. Nevidíme, jak rozhodují. Snadno si myslíme, že vzory = porozumění.

V praxi? Pokud nasadíme takovou AI, doufáme v opravdové myšlení. Ale v nových situacích splaskne. Dá špatné rady s jistotou. Halucinace, chyby v interpretaci. Nebo horší – rozhodnutí, kde jde o život.

Problém, co nikdo nevyřešil

Tady je jádro. Skutečné chápání jazyka je těžší, než jsme čekali. Zachytit úmysl otázky. Proč se ptá. To není jen o shodě vzorů v testech. Potřebujeme pochopit smysl slov v kontextu.

Není to o výkonu počítače. Ani o datech. Je to základy: co slova znamenají.

Závěr

Pád Centauru je v podstatě dobrá zpráva. Vědci se učí odhalovat podvody. Nepřijímají benchmarky naslepo. Rozlišují "dobře testováno" od "opravdu chápe".

Příště, když uslyšíte o AI průlomu, zeptejte se: Co kdybych změnil otázku? Fungovalo by to pořád?

Zdroj: ScienceDaily

#artificial intelligence #ai limitations #language understanding #machine learning #cognitive science #tech skepticism