← Home

ИИ-то, което пробута теста перфектно, без да разбере нито дума

2026-05-01T12:51:03.998195+00:00

Когато AI изглежда умен, но е пълен глупак

Често преценяваме ума по тестове, бързи решения и умни обяснения. Ако нещо се справя супер с куп задачи, мислим си – ето го истинското разбиране! С AI обаче е различно. Той може да те заблуди с увереност, без да разбира нищо на света.

Точно това разбраха учени от Университета в Дзъехоан. Те разобличиха Centaur – AI, който преди време правеше шум, че имитира човешкото мислене.

Centaur – звездата, която угасна бързо

През юли 2025 г. Centaur излезе на светло. Взели обикновен езиков модел, каквито движат чатботовете, и го натренирали с данни от психология. Резултатът? 160 когнитивни задачи – от вземане на решения до контрол – минали на цялата. Всички се вълнуваха: ето пробив към AI, който мисли като хора!

После дойде обратът.

Тестът, който разкри измамата

Екипът реши да провери нещо просто. Замениха истинските психология въпроси с абсурд. Вместо "Кое е правилното решение тук?" – "Моля, избери А".

И какво? AI продължи да дава "правилните" от тренировъчните данни. Игнорира новите инструкции. Просто следваше запаметени шаблони, сякаш чете невидим сценарий.

Като ученик, който е научил цвета на мерката на учителя от стари изпити и рисува по него, без да чете задачата.

Защо това е важно (и малко плашещо)

Това разкрива голям проблем в тестването на AI. Тези модели са майстори на шаблоните – учат се от милиарди примери. Но това не е разбиране. Те са черни кутии, не виждаме как решават. Лесно бъркаме статистика с мозък.

В реалния свят? AI ще дава сигурни грешки в нови ситуации. Халюцинации, погрешни тълкувания. Или решения в критични области – здраве, финанси – където грешката боли.

Проблемът, който никой не е решил

Това ме заинтригува най-много. Истинското разбиране на езика – улавянето на смисъла зад въпроса – е много по-сложно. Шаблоните работят за стандартни задачи. Но да разбереш защо те питат? Това е стената.

Не ни липсва сила или данни. Липсва нещо основно: да знаеш какво значат думите в контекста.

По сутьта

Падането на Centaur е добра новина. Учените стават по-добри в разкриването на слабости. Не вярваме слепо на тестове. И разбираме: добро представяне ≠ истински ум.

Следващия път при AI сензация попитай: ще работи ли, ако променя въпроса?

Източник: https://www.sciencedaily.com/releases/2026/04/260429102035.htm

#artificial intelligence #ai limitations #language understanding #machine learning #cognitive science #tech skepticism