Γιατί το ChatGPT είπε λάθος την ώρα στον Παύλο Πολάκη
Ένα εργαλείο που είναι ικανό να λύσει πολύπλοκα μαθηματικά προβλήματα αλλά όχι να πει σωστά την ώρα; Το πείραμα με το ρολόι αποκαλύπτει τα όρια του ChatGPT και της Τεχνητής Νοημοσύνης.
- 8 ΔΕΚ 2025
Είναι δυνατόν ένα εργαλείο το οποίο μέσα σε λίγα λεπτά μπορεί να σαρώσει και να επεξεργαστεί έναν τεράστιο όγκο δεδομένων γλιτώνοντας κόπο και χρόνο από τον χρήστη, την ίδια στιγμή να αποδεικνύεται ανεπαρκές σε πράγματα τα οποία θεωρούμε εύκολα ακόμη και για ένα μικρό παιδί, όπως το να «διαβάζουμε» την ώρα όταν κοιτάμε το ρολόι;
Το παραπάνω παράδοξο θα διαπιστώσει όποιος ζητήσει από το πιο διάσημο και διαδεδομένο για επαγγελματική χρήση εργαλείο Τεχνητής Νοημοσύνης να του πει την ώρα με βάση μια φωτογραφία ρολογιού. Το ίδιο έκανε και ο Παύλος Πολάκης, αναρτώντας τη σουρεαλιστική απάντηση του ChatGPT, λίγες ώρες μετά την εξίσου σουρεαλιστική δικαιολογία περί «υψοφοβίας από τα θεωρεία» που είχε προβάλλει για την απουσία του απ’ την παρουσίαση του βιβλίου Τσίπρα στο Παλλάς – δύο φαινομενικά ασύνδετα γεγονότα.
Αφορμή στάθηκε ένα συνέδριο το οποίο παρακολούθησε ο βουλευτής του ΣΥΡΙΖΑ – Π.Σ. με τη δεύτερη ιδιότητά του, ως χειρουργού εντατικολόγου. Όπως αναφέρει πιο συγκεκριμένα στην ανάρτηση, το έναυσμα για αυτό το απλό prompt έδωσε η ομιλία του χημικού μηχανικού και συγγραφέα Αντώνη Μαυρόπουλου, που (αν κρίνουμε από το βιβλίο το οποίο κυκλοφόρησε πρόσφατα) υποστήριξε την ανάγκη απομάγευσης από τον «θαυμαστό καινούργιο κόσμο» που πιστεύουμε ότι γεννά η Τεχνητή Νοημοσύνη – πρωτίστως, διότι δεν τον γεννά, αλλά τον αναπαράγει, και όχι όσο καλά φαίνεται.
Τι εννοούμε;
Ότι παρά τον γενικό ενθουσιασμό και την άκρατη εμπιστοσύνη που δείχνουμε στα LLMs όσο εξοικειωνόμαστε στη χρήση τους (θυμίζουμε ότι 8 στους 10 χρήστες του ChatGPT παγκοσμίως έχουν ζητήσει τουλάχιστον μία φορά ιατρικές συμβουλές και γνωματεύσεις), στην ουσία τα μοντέλα αυτά «σκέφτονται» αποκλειστικά μέσα από μοτίβα και δεδομένα τα οποία ήδη υπάρχουν. Στην ανάγκη, σκαρφίζονται πειστικές αλλά καθόλου υπαρκτές πληροφορίες (τα λεγόμενα “AI hallucinations”), ενώ αποτυγχάνει παταγωδώς στην αφηρημένη σκέψη και την απλή χωρική αντίληψη.
Χαρακτηριστικό παράδειγμα για τα όρια της ΤΝ είναι και το πείραμα με το ρολόι.
Το διάσημο bug της ΤΝ με την ώρα
Όπως βλέπουμε στο παράδειγμα διαλόγου που μοιράστηκε δημόσια ο πρώην υπουργός, το πρόβλημα δεν έγκειται στη χαμηλής ποιότητας εικόνα που ζητάει ο χρήστης από το ChatGPT να «διαβάσει» – το πρόβλημα έγκειται στα δομικά όρια τα οποία έχει από τη φύση του ένα τέτοιο μοντέλο (τουλάχιστον, με τη μορφή που το γνωρίζουμε μέχρι σήμερα).
Πιο συγκεκριμένα, για τη σπαζοκεφαλιά που συνεχίζει να «ταλαιπωρεί» αυτά τα μοντέλα ευθύνεται ένας συνδυασμός ανάμεσα στην έλλειψη αντίληψης χώρου και την αδυναμία κατανόησης της λειτουργίας του ρολογιού ως οργάνου ένδειξης ώρας (ειδικά όταν αλλάζει η εμφάνιση του ρολογιού σε σχέση με αυτές που έχει τροφοδοτηθεί το μοντέλο ΤΝ κατά την εκπαίδευσή του). Με άλλα λόγια, το μοντέλο αδυνατεί να καταλάβει τη χωρική θέση των δεικτών του ρολογιού, ούτε και γιατί στο καλό η θέση τους σχετίζεται με την ώρα.
Το παραπάνω συμπέρασμα αποτελεί αποτέλεσμα πρόσφατης έρευνας από το Πανεπιστήμιο του Εδιμβούργου. Οι ερευνητές δοκίμασαν μερικά από τα πιο προηγμένα μοντέλα ΤΝ με αναγνώριση εικόνας (όπως τις τελευταίες εκδόσεις του ChatGPT και του Gemini) στην ανάγνωση ώρας: τροφοδότησαν τα μοντέλα με εκατοντάδες εικόνες που απεικόνιζαν διαφορετικούς τύπους ρολογιών από διαφορετικές γωνίες, ζητώντας από εκείνα να διαβάσουν απλά την ώρα που δείχνουν οι δείκτες.
Το ποσοστό της επιτυχίας έφτασε μετά βίας το 25%.
Οι επιδόσεις των πολυτροπικών LLMs, όπως σημειώνουν οι ερευνητές, έχουν βελτιωθεί μεν σε σχέση με παλαιότερα, αλλά παραμένουν απογοητευτικές μπροστά σε αυτό το απλό πρόβλημα. Ακόμη πιο σίγουρη είναι η αποτυχία, όταν το ρολόι περιλαμβάνει ρωμαϊκούς αριθμούς ή καλλιτεχνικά σχέδια, κάτι που οπτικά δηλαδή απέχει από την τυπική εικόνα των ρολογιών, με την οποία πιθανότατα εκπαιδεύτηκαν.
Εάν βέβαια το μοντέλο του βουλευτή είχε τροποποιηθεί ώστε να απαντά με χιούμορ, θα έλεγε «ό,τι ώρα πεις εσύ κύριε Πρόεδρε».
Ακολουθήστε το OneMan στο Google News και μάθετε τις σημαντικότερες ειδήσεις.