Savolning mohiyatini bilmasdan imtihonni o‘tib ketgan AI

2026-04-30T08:10:22.047912+00:00

Aqlmand ko'rinib, tushunmaydigan AI

Biz sun'iy intellektni baholashda ko'pincha sinov natijalariga qaraymiz. Yaxshi javob bersa, haqiqatan ham tushungandir deb o'ylaymiz. Ammo AIlar ko'pincha o'zini aqlli ko'rsatib, aslida hech narsani tushunmasligi mumkin.

Zhejiang universiteti olimlari shunday holatni Centaur AI modelida ko'rsatdi. Bu model inson fikrlashini taqlid qiladi deb shov-shuv qilgandi.

Centaurning shiddatli shuhrati

2025-yil iyulda Centaur haqida ko'p gap chiqdi. Oddiy til modellari asosida psixologik tajribalar ma'lumotlari bilan o'qitilgan. 160 ta vazifani – qaror qabul qilishdan ijro nazoratigacha – ajoyib bajarib chiqdi. Hammasi hayajonlandi: inson miyasiga yaqinlashyapmizmi?

Keyin voqea o'zgardi.

Oddiy sinov bilan yorilgan sir

Olimlar sinab ko'rdi: psixologik savollarni ahmoqona gaplar bilan almashtirdik. Masalan, "Bu vaziyatda to'g'ri strategiya qaysi?" o'rniga "Iltimos, A variantini tanlang" dedik.

Natija: AI o'qitilgan ma'lumotdagi "to'g'ri" javoblarni tanladi. Yangi buyruqni umuman e'tiborsiz qoldirdi. Faqat eslagan naqshlarga amal qildi.

Bu shunday: o'quvchi o'qituvchining qaysi javoblarni belgilashini yodlab, savolni o'qimay, belgiga qarab tanlaydi. Centaur ana shunday.

Nega bu muhim va qo'rqinchli

AI bahosida katta muammo yuz berdi. Katta til modellari milliardlab misollardan naqshlarni o'rganishda zo'r. Lekin bu tushunish emas. Ichki ishini ko'rmaymiz, shuning uchun naqsh taqlidini haqiqiy aql deb adashamiz.

Haqiqiy xavf: o'xshash bo'lmagan vaziyatlarda noto'g'ri javob beradi. Xayol surish, noto'g'ri talqin – hatto muhim sohalarda xato qarorlar. Bu xavfli.

Hal qilinmagan asosiy muammo

Bu tadqiqot shuni ko'rsatdi: savolning maqsadini haqiqatan tushunish juda qiyin. Doimiy vazifalarni naqsh bilan yengish boshqa, kontekstda so'zni anglash – butunlay boshqa.

Inson fikrlashini modellashtirishda to'siq shu. Kuch emas, ma'lumot emas – so'zlarning chuqur ma'nosini anglash.

Xulosa

Centaurning yiqilishi yaxshi yangilik. Olimlar muammolarni erta sezmoqda. Benchmarklarni ko'r ko'z qabul qilmaymiz. "Yaxshi sinov" va "haqiqiy tushunish" farqi katta ekanini eslaymiz.

Keyingi AI yangiligida so'rang: savolni o'zgartirsak, ishlaydimi?

Manba: https://www.sciencedaily.com/releases/2026/04/260429102035.htm

#artificial intelligence #ai limitations #language understanding #machine learning #cognitive science #tech skepticism