Το AGI δεν είναι προ των πυλών

Γιατί η Γενική Τεχνητή Νοημοσύνη παραμένει μακρινός στόχος

Η δημόσια συζήτηση γύρω από την Τεχνητή Νοημοσύνη έχει μετατοπιστεί από τις πρακτικές εφαρμογές των μεγάλων γλωσσικών μοντέλων σε έναν σχεδόν μεταφυσικό ορίζοντα προσδοκιών: την επίτευξη Τεχνητής Γενικής Νοημοσύνης. Η ιδέα ότι τα σημερινά συστήματα παραγωγικής ΤΝ αποτελούν προθάλαμο του AGI έχει διαδοθεί τόσο ευρέως ώστε συχνά αντιμετωπίζεται ως αυτονόητη. Ωστόσο, η επιστημονική τεκμηρίωση οδηγεί σε πολύ διαφορετικά συμπεράσματα.

Στατιστική πρόβλεψη αντί κατανόησης

Τα μεγάλα γλωσσικά μοντέλα βασίζονται σε στοχαστική πρόβλεψη επόμενων λέξεων. Όπως έχει επισημάνει επανειλημμένα ο Gary Marcus, η αρχιτεκτονική τους δεν ενσωματώνει μηχανισμούς σημασιολογικής κατανόησης, αιτιακής αναπαράστασης ή μοντελοποίησης της πραγματικότητας. Τα φαινόμενα «παραισθήσεων» δεν αποτελούν περιφερειακή ατέλεια αλλά συστημικό χαρακτηριστικό.

Η έρευνα στην αιτιακή μάθηση, όπως έχει αναπτυχθεί από τον Judea Pearl, δείχνει ότι η γενίκευση πέρα από τα δεδομένα απαιτεί ρητά μοντέλα αιτιότητας. Τα σημερινά LLMs δεν διαθέτουν τέτοιες δομές. Αντίστοιχα, η θεωρητική κριτική της Emily Bender υπογραμμίζει ότι τα μοντέλα αυτά αναπαράγουν γλωσσικές κανονικότητες χωρίς αναφορά σε εξωγλωσσική σημασία.

Περιορισμένη επιχειρησιακή ικανότητα

Εμπειρικές μελέτες επιβεβαιώνουν τα παραπάνω. Ο δείκτης The Remote Labor Index εκτίμησε ότι τα συστήματα αυτά μπορούν να αναλάβουν πλήρως μόλις ένα ελάχιστο ποσοστό ανθρώπινων εργασιών, εξαιρώντας μάλιστα τη φυσική εργασία. Ακόμη και σε γνωστικά πεδία, η απόδοσή τους χαρακτηρίζεται από αστάθεια και ανάγκη διαρκούς ανθρώπινης επιτήρησης.

Η αδυναμία σταθερής συλλογιστικής έχει αποτυπωθεί και σε ακαδημαϊκές αξιολογήσεις, όπως το benchmark BIG-bench, όπου η επίδοση συχνά εξαρτάται από επιφανειακές γλωσσικές ενδείξεις. Η κλιμάκωση παραμέτρων δεν έχει αποδείξει ότι οδηγεί σε ποιοτικό άλμα προς γενική νοημοσύνη, αλλά κυρίως σε βελτιωμένη μίμηση προτύπων.

Το χάσμα μεταξύ AGI και σημερινών συστημάτων

Το AGI προϋποθέτει διαθεματική μεταφορά γνώσης, ενσωματωμένη αντίληψη, αυτοτελή στοχοθεσία και ανθεκτική κατανόηση φυσικού και κοινωνικού περιβάλλοντος. Καμία από αυτές τις ιδιότητες δεν προκύπτει μηχανιστικά από την αύξηση δεδομένων ή υπολογιστικής ισχύος.

Επιπλέον, η έλλειψη ενσωματωμένης φυσικής αλληλεπίδρασης με τον κόσμο αποτελεί θεμελιώδες όριο. Η ανθρώπινη νοημοσύνη διαμορφώνεται μέσω αισθητηριακής εμπειρίας και πράξης. Τα σημερινά συστήματα λειτουργούν αποκομμένα από τέτοια πλαίσια.

Οικονομική υπερβολή και τεχνολογικός ρεαλισμός

Η δημόσια αφήγηση που ταυτίζει τα LLMs με προάγγελο AGI έχει οδηγήσει σε επενδυτική υπερθέρμανση. Ωστόσο, η ιστορία της τεχνολογίας δείχνει ότι η συμβολική υπερπροβολή δεν ισοδυναμεί με επιστημονική ωριμότητα. Η σύγχυση μεταξύ στατιστικής συσχέτισης και κατανόησης απειλεί να υποκαταστήσει τον νηφάλιο σχεδιασμό πολιτικής.

Η υπεύθυνη στρατηγική απαιτεί διαχωρισμό μεταξύ χρήσιμων εφαρμογών και θεωρητικών υπερβάσεων. Η Γενική Τεχνητή Νοημοσύνη δεν προκύπτει ως φυσική συνέχεια της σημερινής παραγωγικής ΤΝ. Αντιθέτως, απαιτεί θεμελιώδη επιστημονικά άλματα που ακόμη δεν διαφαίνονται.

Η τεκμηριωμένη αξιολόγηση συγκλίνει στο ότι το AGI δεν βρίσκεται σε άμεσο ορίζοντα. Τα υπάρχοντα συστήματα αποτελούν ισχυρά εργαλεία στατιστικής επεξεργασίας, όχι φορείς γενικής κατανόησης. Η πολιτική και επενδυτική στρατηγική οφείλει να βασίζεται σε επιστημονικό ρεαλισμό και όχι σε αφηγήσεις τεχνολογικής παντοδυναμίας.

Πηγές:

Gary Marcus, “Turns Out Generative AI Was a Scam”, ανάλυση για τους περιορισμούς των LLMs, https://garymarcus.substack.com/p/turns-out-generative-ai-was-a-scam

Emily M. Bender et al., “On the Dangers of Stochastic Parrots”, κριτική για τη φύση των LLMs, https://dl.acm.org/doi/10.1145/3442188.3445922

Judea Pearl, “The Book of Why”, θεωρία αιτιακής συλλογιστικής, https://www.basicbooks.com/titles/judea-pearl/the-book-of-why/9780465097609/

BIG-bench Benchmark, αξιολόγηση συλλογιστικών ικανοτήτων LLMs, https://github.com/google/BIG-bench