Όταν η Τεχνητή Νοημοσύνη Παριστάνει την Έξυπνη (Μα Δεν Είναι)
Πώς κρίνουμε την εξυπνάδα; Κοιτάμε βαθμούς. Παρατηρούμε πώς λύνει προβλήματα κάποιος. Ακούμε εξηγήσεις. Συνήθως, καλά αποτελέσματα σε πολλές δοκιμασίες σημαίνουν πραγματική κατανόηση. Με την ΤΝ όμως ισχύει κάτι άλλο. Μπορεί να δίνει την εντύπωση βαθιάς γνώσης χωρίς να καταλαβαίνει τίποτα.
Αυτό ακριβώς έδειξαν ερευνητές από το Πανεπιστήμιο του Zhejiang. Εξέτασαν το Centaur, ένα σύστημα που έκανε θόρυβο γιατί μιμείτο ανθρώπινη σκέψη.
Το Centaur: Υπόσχεση ή Ψευδαίσθηση;
Το καλοκαίρι του 2025, το Centaur έγινε viral. Πήραν ένα απλό μοντέλο γλώσσας, το "έθρεψαν" με δεδομένα από ψυχολογικά πειράματα. Ταξινόμησε 160 γνωστικά τεστ τέλεια. Από αποφάσεις μέχρι έλεγχο συγκέντρωσης. Όλοι ενθουσιάστηκαν. "Μήπως φτάσαμε σε ΤΝ σαν τον εγκέφαλό μας;"
Μετά ήρθε η αποκάλυψη.
Η Απλή Δοκιμή που τα Γκρέμισε Όλα
Οι νέοι ερευνητές δοκίμασαν κάτι βασικό. Αντί για κανονικές ερωτήσεις ψυχολογίας, έβαλαν γελοίες εντολές. "Διάλεξε το Α, παρακαλώ". Τι έγινε; Το Centaur συνέχισε να "επιλέγει" τις σωστές απαντήσεις από τα παλιά δεδομένα. Αγνόησε εντελώς την καινούργια οδηγία. Ακολουθούσε memorized μοτίβα σαν ρομπότ.
Φαντάσου μαθητή που ξέρει πού βάφει ο δάσκαλος τις σωστές απαντήσεις στα παλιά τεστ. Δεν διαβάζει ερωτήσεις. Απλά μαρκάρει βάσει υπνωτισμού. Έτσι λειτουργεί το Centaur.
Γιατί Αυτό Είναι Σημαντικό (και Λίγο Τρομακτικό)
Αποκαλύπτει πρόβλημα στα τεστ ΤΝ. Τα μεγάλα μοντέλα μαθαίνουν στατιστικά μοτίβα από δισεκατομμύρια παραδείγματα. Αλλά αυτό δεν είναι κατανόηση. Λειτουργούν σαν μαύρα κουτιά. Δεν βλέπουμε πώς αποφασίζουν. Έτσι, μπερδεύουμε έξυπνο pattern matching με αληθινή νοημοσύνη.
Στην πράξη; Κίνδυνος. Σε καινούργια σενάρια, δίνουν σίγουρα λάθη. Hallucinations. Λάθος ερμηνείες. Ή χειρότερα, λάθος αποφάσεις σε κρίσιμα πεδία.
Το Μεγάλο Αγκάθι που Δεν Λύνεται
Το ενδιαφέρον εδώ; Η πραγματική κατανόηση γλώσσας –το νόημα πίσω από λέξεις– είναι πολύ πιο δύσκολη. Όχι θέμα ισχύος υπολογιστών. Όχι δεδομένων. Αλλά βάθους: τι σημαίνουν πραγματικά οι λέξεις ανάλογα με το πλαίσιο.
Για ΤΝ που μιμείται ανθρώπινη σκέψη, εδώ σκοντάφτουμε.
Συμπέρασμα
Η "πτώση" του Centaur είναι θετική είδηση. Οι επιστήμονες πιάνουν τέτοια κόλπα. Ρωτάνε σωστές ερωτήσεις. Δεν εμπιστεύονται εύκολα benchmarks. Υπενθυμίζει: καλά τεστ ≠ αληθινή κατανόηση.
Επόμενη φορά που ακούς για ΤΝ-θαύμα, σκέψου: αν αλλάξω ερώτηση, θα αντέξει;
Πηγή: ScienceDaily