← Home

KI-en som knuste testen – uten å skjønne et pip av spørsmålene

2026-04-30T08:08:19.101080+00:00

Når AI Lurer Oss til å Tro på Forståelse

Vi dømmer intelligens på enkle måter. Høye poengsummer. Smarte løsninger på oppgaver. Klare forklaringer. Ofte tenker vi at god ytelse på mange tester betyr ekte innsikt. Men AI spiller et annet spill. Den kan virke selvsikker og smart – uten å forstå et skvett.

Forskere fra Zhejiang University avdekket nettopp dette i en AI kalt Centaur. Den fikk mye oppmerksomhet for å etterligne menneskelig tenkning. Men det holdt ikke vann.

Centaur – Den Perfekte Juksemakeren?

I juli 2025 traff Centaur overskriftene. Forskere trente en stor språkmodell på ekte psykologiske eksperimenter. Resultatene imponerte: 160 kognitive oppgaver mestret, fra valg til selvkontroll. Alle jublet. Endelig AI som tenker som oss!

Så kom avsløringen.

Enkel Test Som Røpet Bløffen

Forskere byttet ut spørsmålene med tull. I stedet for "Hvilken strategi er riktig her?" sa de bare "Velg A". Hva skjedde? AI-en plukket fortsatt de opprinnelige riktige svarene. Den ignorerte den nye instruksen fullstendig. Bare fulgte minnede mønstre som en robot på autopilot.

Tenk deg en elev som husker hvilke svarlarkrager læreren markerer på gamle prøver. Den velger basert på prikker og farger – ikke spørsmålene. Akkurat sånn fungerte Centaur.

Hvorfor Dette Er Alvorlig (Og Litt Skummelt)

Vi tester AI feil i dag. Disse modellene er mestere på å lære mønstre fra milliarder av eksempler. Men det er ikke forståelse. De er svarte bokser – vi ser ikke innsiden. Dermed forveksler vi avansert statistikk med ekte hjernevirksomhet.

Konsekvensene? AI som trygt spyr ut vrangforestillinger i nye situasjoner. Feiltolkninger. Eller verre: beslutninger i kritiske områder som helse og sikkerhet.

Kjernen i Problemet – Fortsatt Uløst

Dette viser noe stort: Å gripe intensjonen bak et spørsmål er tøft. Mønsterkjenning på kjente oppgaver er lett. Men å forstå kontekst og mening? Det er veggen vi står ved. Ikke mangel på prosessorkraft eller data. Men hva ord egentlig betyr.

Konklusjonen

Centaur-fiaskoen er positivt på sin måte. Forskere blir flinkere til å stille kritiske spørsmål. Vi lærer å ikke stole blindt på fine benchmarks. Det minner oss: God på tester betyr ikke klok.

Neste gang en AI feires – test den. Endre spørsmålet litt. Ser du forskjellen?

Kilde: https://www.sciencedaily.com/releases/2026/04/260429102035.htm

#artificial intelligence #ai limitations #language understanding #machine learning #cognitive science #tech skepticism