Γιατί το ChatGPT είπε λάθος την ώρα στον Παύλο Πολάκη

Είναι δυνατόν ένα εργαλείο το οποίο μέσα σε λίγα λεπτά μπορεί να σαρώσει και να επεξεργαστεί έναν τεράστιο όγκο δεδομένων γλιτώνοντας κόπο και χρόνο από τον χρήστη, την ίδια στιγμή να αποδεικνύεται ανεπαρκές σε πράγματα τα οποία θεωρούμε εύκολα ακόμη και για ένα μικρό παιδί, όπως το να «διαβάζουμε» την ώρα όταν κοιτάμε το ρολόι;

Το παραπάνω παράδοξο θα διαπιστώσει όποιος ζητήσει από το πιο διάσημο και διαδεδομένο για επαγγελματική χρήση εργαλείο Τεχνητής Νοημοσύνης να του πει την ώρα με βάση μια φωτογραφία ρολογιού. Το ίδιο έκανε και ο Παύλος Πολάκης, αναρτώντας τη σουρεαλιστική απάντηση του ChatGPT, λίγες ώρες μετά την εξίσου σουρεαλιστική δικαιολογία περί «υψοφοβίας από τα θεωρεία» που είχε προβάλλει για την απουσία του απ’ την παρουσίαση του βιβλίου Τσίπρα στο Παλλάς – δύο φαινομενικά ασύνδετα γεγονότα.

Αφορμή στάθηκε ένα συνέδριο το οποίο παρακολούθησε ο βουλευτής του ΣΥΡΙΖΑ – Π.Σ. με τη δεύτερη ιδιότητά του, ως χειρουργού εντατικολόγου. Όπως αναφέρει πιο συγκεκριμένα στην ανάρτηση, το έναυσμα για αυτό το απλό prompt έδωσε η ομιλία του χημικού μηχανικού και συγγραφέα Αντώνη Μαυρόπουλου, που (αν κρίνουμε από το βιβλίο το οποίο κυκλοφόρησε πρόσφατα) υποστήριξε την ανάγκη απομάγευσης από τον «θαυμαστό καινούργιο κόσμο» που πιστεύουμε ότι γεννά η Τεχνητή Νοημοσύνη – πρωτίστως, διότι δεν τον γεννά, αλλά τον αναπαράγει, και όχι όσο καλά φαίνεται.

Τι εννοούμε;

Ότι παρά τον γενικό ενθουσιασμό και την άκρατη εμπιστοσύνη που δείχνουμε στα LLMs όσο εξοικειωνόμαστε στη χρήση τους (θυμίζουμε ότι 8 στους 10 χρήστες του ChatGPT παγκοσμίως έχουν ζητήσει τουλάχιστον μία φορά ιατρικές συμβουλές και γνωματεύσεις), στην ουσία τα μοντέλα αυτά «σκέφτονται» αποκλειστικά μέσα από μοτίβα και δεδομένα τα οποία ήδη υπάρχουν. Στην ανάγκη, σκαρφίζονται πειστικές αλλά καθόλου υπαρκτές πληροφορίες (τα λεγόμενα “AI hallucinations”), ενώ αποτυγχάνει παταγωδώς στην αφηρημένη σκέψη και την απλή χωρική αντίληψη.

Χαρακτηριστικό παράδειγμα για τα όρια της ΤΝ είναι και το πείραμα με το ρολόι.

Το διάσημο bug της ΤΝ με την ώρα

Όπως βλέπουμε στο παράδειγμα διαλόγου που μοιράστηκε δημόσια ο πρώην υπουργός, το πρόβλημα δεν έγκειται στη χαμηλής ποιότητας εικόνα που ζητάει ο χρήστης από το ChatGPT να «διαβάσει» – το πρόβλημα έγκειται στα δομικά όρια τα οποία έχει από τη φύση του ένα τέτοιο μοντέλο (τουλάχιστον, με τη μορφή που το γνωρίζουμε μέχρι σήμερα).

Πιο συγκεκριμένα, για τη σπαζοκεφαλιά που συνεχίζει να «ταλαιπωρεί» αυτά τα μοντέλα ευθύνεται ένας συνδυασμός ανάμεσα στην έλλειψη αντίληψης χώρου και την αδυναμία κατανόησης της λειτουργίας του ρολογιού ως οργάνου ένδειξης ώρας (ειδικά όταν αλλάζει η εμφάνιση του ρολογιού σε σχέση με αυτές που έχει τροφοδοτηθεί το μοντέλο ΤΝ κατά την εκπαίδευσή του). Με άλλα λόγια, το μοντέλο αδυνατεί να καταλάβει τη χωρική θέση των δεικτών του ρολογιού, ούτε και γιατί στο καλό η θέση τους σχετίζεται με την ώρα.

Το παραπάνω συμπέρασμα αποτελεί αποτέλεσμα πρόσφατης έρευνας από το Πανεπιστήμιο του Εδιμβούργου. Οι ερευνητές δοκίμασαν μερικά από τα πιο προηγμένα μοντέλα ΤΝ με αναγνώριση εικόνας (όπως τις τελευταίες εκδόσεις του ChatGPT και του Gemini) στην ανάγνωση ώρας: τροφοδότησαν τα μοντέλα με εκατοντάδες εικόνες που απεικόνιζαν διαφορετικούς τύπους ρολογιών από διαφορετικές γωνίες, ζητώντας από εκείνα να διαβάσουν απλά την ώρα που δείχνουν οι δείκτες.

Το ποσοστό της επιτυχίας έφτασε μετά βίας το 25%.

Οι επιδόσεις των πολυτροπικών LLMs, όπως σημειώνουν οι ερευνητές, έχουν βελτιωθεί μεν σε σχέση με παλαιότερα, αλλά παραμένουν απογοητευτικές μπροστά σε αυτό το απλό πρόβλημα. Ακόμη πιο σίγουρη είναι η αποτυχία, όταν το ρολόι περιλαμβάνει ρωμαϊκούς αριθμούς ή καλλιτεχνικά σχέδια, κάτι που οπτικά δηλαδή απέχει από την τυπική εικόνα των ρολογιών, με την οποία πιθανότατα εκπαιδεύτηκαν.

Εάν βέβαια το μοντέλο του βουλευτή είχε τροποποιηθεί ώστε να απαντά με χιούμορ, θα έλεγε «ό,τι ώρα πεις εσύ κύριε Πρόεδρε».

ΣΧΕΤΙΚΟ ΘΕΜΑ

LONGREADS

Γιατί το ChatGPT είπε λάθος την ώρα στον Παύλο Πολάκη

Το διάσημο bug της ΤΝ με την ώρα

Όταν ζητάς από το ChatGPT να σου λύσει τα προβλήματα

Ρωτήσαμε το ChatGPT αν σκοπεύει να αντικαταστήσει τους ψυχολόγους

Στον επόμενο τόνο, το ChatGPT θα εκπληρώνει και ερωτικές φαντασιώσεις

Η φράση που καταστρέφει την επικοινωνία (και γιατί να μην τη λες)

Πλύσιμο πιάτων στο πλυντήριο ή στο χέρι; Ποιο προσφέρει μεγαλύτερη εξοικονόμηση;

Anok Yai: 6 άγνωστες πτυχές της ζωής της, από τον ρατσισμό μέχρι τη σοβαρή περιπέτεια υγείας

Πώς μπορείς να χάσεις την όρασή σου από ένα τατουάζ στην πλάτη

Παρουσίαση Ομπράντοβιτς: Αποκάλυψε τον πρώτο παίκτη που μίλησε από τον Παναθηναϊκό AKTOR

Παρουσίαση Ομπράντοβιτς: Η ατάκα του προς τον Αλβέρτη στα ελληνικά σε ερώτηση του SPORT24

Παρουσίαση Ομπράντοβιτς: Ο μεταφραστής μπέρδεψε τον Παναθηναϊκό με τον Ολυμπιακό και προκάλεσε το γέλιο των Ομπράντοβιτς - Γιαννακόπουλου

Παρουσίαση Ομπράντοβιτς: Η απόφαση της επιστροφής, ο Γιαννακόπουλος, ο Σλούκας, το 8ο αστέρι και η αποθέωση στον κόσμο του Παναθηναϊκού