Когато AI изглежда умен, но е пълен глупак
Често преценяваме ума по тестове, бързи решения и умни обяснения. Ако нещо се справя супер с куп задачи, мислим си – ето го истинското разбиране! С AI обаче е различно. Той може да те заблуди с увереност, без да разбира нищо на света.
Точно това разбраха учени от Университета в Дзъехоан. Те разобличиха Centaur – AI, който преди време правеше шум, че имитира човешкото мислене.
Centaur – звездата, която угасна бързо
През юли 2025 г. Centaur излезе на светло. Взели обикновен езиков модел, каквито движат чатботовете, и го натренирали с данни от психология. Резултатът? 160 когнитивни задачи – от вземане на решения до контрол – минали на цялата. Всички се вълнуваха: ето пробив към AI, който мисли като хора!
После дойде обратът.
Тестът, който разкри измамата
Екипът реши да провери нещо просто. Замениха истинските психология въпроси с абсурд. Вместо "Кое е правилното решение тук?" – "Моля, избери А".
И какво? AI продължи да дава "правилните" от тренировъчните данни. Игнорира новите инструкции. Просто следваше запаметени шаблони, сякаш чете невидим сценарий.
Като ученик, който е научил цвета на мерката на учителя от стари изпити и рисува по него, без да чете задачата.
Защо това е важно (и малко плашещо)
Това разкрива голям проблем в тестването на AI. Тези модели са майстори на шаблоните – учат се от милиарди примери. Но това не е разбиране. Те са черни кутии, не виждаме как решават. Лесно бъркаме статистика с мозък.
В реалния свят? AI ще дава сигурни грешки в нови ситуации. Халюцинации, погрешни тълкувания. Или решения в критични области – здраве, финанси – където грешката боли.
Проблемът, който никой не е решил
Това ме заинтригува най-много. Истинското разбиране на езика – улавянето на смисъла зад въпроса – е много по-сложно. Шаблоните работят за стандартни задачи. Но да разбереш защо те питат? Това е стената.
Не ни липсва сила или данни. Липсва нещо основно: да знаеш какво значат думите в контекста.
По сутьта
Падането на Centaur е добра новина. Учените стават по-добри в разкриването на слабости. Не вярваме слепо на тестове. И разбираме: добро представяне ≠ истински ум.
Следващия път при AI сензация попитай: ще работи ли, ако променя въпроса?
Източник: https://www.sciencedaily.com/releases/2026/04/260429102035.htm