Γιατί τα σημερινά LLMs δεν αυτοεξελίσσονται όσο πιστεύουμε
Η διαφορά ανάμεσα στη βελτίωση και στην κατανόηση της εμπειρίας
Η συζήτηση για την Τεχνητή Νοημοσύνη έχει γεμίσει από μια ισχυρή υπόσχεση: ότι τα μεγάλα γλωσσικά μοντέλα, όταν λειτουργούν ως agents, μπορούν να μαθαίνουν από τις προηγούμενες εμπειρίες τους και να βελτιώνονται συνεχώς χωρίς νέα εκπαίδευση. Η εικόνα είναι ελκυστική. Ένας agent δοκιμάζει, αποτυγχάνει, κρατά σημειώσεις, συμπυκνώνει τα διδάγματα και την επόμενη φορά τα αξιοποιεί. Έτσι, υποτίθεται, αρχίζει μια μορφή αυτο-εξέλιξης.
Όμως αυτή η υπόθεση χρειάζεται πολύ μεγαλύτερη προσοχή. Η πρόσφατη εργασία “Large Language Model Agents Are Not Always Faithful Self-Evolvers” δείχνει ότι η απόδοση ενός agent μπορεί πράγματι να βελτιώνεται όταν του δίνεται πρόσβαση σε προηγούμενες εμπειρίες, αλλά αυτό δεν σημαίνει ότι ο agent χρησιμοποιεί την εμπειρία με τρόπο πιστό, αιτιακό και ελέγξιμο. Με απλά λόγια, δεν αρκεί να βλέπουμε ότι το σύστημα τα πάει καλύτερα. Πρέπει να ξέρουμε γιατί τα πάει καλύτερα.
Το κρίσιμο εύρημα είναι η μεγάλη διαφορά ανάμεσα στην ακατέργαστη και στη συμπυκνωμένη εμπειρία. Η ακατέργαστη εμπειρία περιλαμβάνει συγκεκριμένες διαδρομές: τι είδε ο agent, τι έκανε, ποια βήματα ακολούθησε, πού πέτυχε και πού απέτυχε. Η συμπυκνωμένη εμπειρία είναι κάτι διαφορετικό: σύντομες οδηγίες, γενικές αρχές, αποστάγματα, κανόνες και υποτιθέμενα διδάγματα. Οι σημερινές μέθοδοι αυτο-εξέλιξης βασίζονται συχνά στην ιδέα ότι αυτά τα συμπυκνωμένα διδάγματα μεταφέρουν τη χρήσιμη γνώση από το παρελθόν στο παρόν. Η εργασία δείχνει ότι αυτό δεν συμβαίνει αξιόπιστα.
Το πρόβλημα της συμπυκνωμένης εμπειρίας
Οι agents φαίνεται να αξιοποιούν πολύ πιο σταθερά τις πλήρεις διαδρομές εμπειρίας παρά τις αφηρημένες περιλήψεις τους. Όταν οι ερευνητές αλλοίωσαν, αφαίρεσαν ή αντικατέστησαν την ακατέργαστη εμπειρία, η απόδοση των agents συχνά μειώθηκε αισθητά. Αυτό σημαίνει ότι το σύστημα πράγματι στηριζόταν σε εκείνα τα συγκεκριμένα ίχνη. Αντίθετα, όταν αλλοιώθηκαν οι συμπυκνωμένες εμπειρίες, πολλές φορές η συμπεριφορά του agent άλλαξε λίγο ή καθόλου. Ακόμη πιο ανησυχητικό είναι ότι σε ορισμένες περιπτώσεις οι agents συνέχισαν να αποδίδουν καλά ακόμη και όταν η συμπυκνωμένη εμπειρία ήταν άσχετη, διεφθαρμένη ή σχεδόν κενή νοήματος.
Αυτό ανατρέπει μια βασική παραδοχή πολλών συστημάτων μνήμης: ότι η περίληψη μιας εμπειρίας κρατά το ουσιώδες. Στην πράξη, η περίληψη μπορεί να χάσει τη συγκεκριμένη σχέση με το πρόβλημα. Μπορεί να γίνει πολύ γενική, να παραπλανήσει το μοντέλο ή να ενισχύσει λανθασμένες προκαταλήψεις. Ένας κανόνας όπως «έλεγξε πρώτα το βασικό μενού» μπορεί να είναι χρήσιμος σε μια ιστοσελίδα και άχρηστος ή επιβλαβής σε μια άλλη. Αν ο agent τον ακολουθήσει μηχανικά, δεν μαθαίνει. Απλώς μεταφέρει μια παλιά συνήθεια σε ένα νέο περιβάλλον.
Εδώ φαίνεται το όριο της σημερινής αυτο-εξέλιξης. Τα συστήματα δεν αποκτούν απαραίτητα βαθύτερη κατανόηση. Συχνά συσσωρεύουν ίχνη, περιλήψεις και μοτίβα που άλλοτε βοηθούν και άλλοτε θολώνουν την κρίση τους. Η εμπειρία δεν είναι γνώση από μόνη της. Γίνεται γνώση μόνο όταν εντάσσεται σωστά στο τρέχον πρόβλημα, όταν ελέγχεται, όταν τεκμηριώνεται και όταν μπορεί να αμφισβητηθεί.
Γιατί η κλίμακα δεν λύνει το πρόβλημα
Μια εύκολη απάντηση θα ήταν ότι τα μεγαλύτερα μοντέλα θα λύσουν το πρόβλημα. Η εργασία δείχνει ότι αυτό δεν είναι ασφαλές συμπέρασμα. Τα μεγαλύτερα μοντέλα έχουν συνήθως καλύτερη συνολική απόδοση, αλλά το χάσμα ανάμεσα στην αξιοποίηση της ακατέργαστης και της συμπυκνωμένης εμπειρίας παραμένει. Με άλλα λόγια, η αύξηση των παραμέτρων δεν εγγυάται πιο πιστή χρήση της μνήμης.
Αυτό έχει πολιτική και θεσμική σημασία. Η ρητορική περί αυτοβελτιούμενης νοημοσύνης συχνά χρησιμοποιείται για να εμφανίσει την ΤΝ ως σχεδόν αναπόφευκτη δύναμη που απλώς χρειάζεται περισσότερη υπολογιστική ισχύ, περισσότερα δεδομένα και λιγότερη καθυστέρηση από τη δημόσια λογοδοσία. Όμως αν η ίδια η τεχνική βάση της αυτο-εξέλιξης είναι ασταθής, τότε η κοινωνία δεν πρέπει να αποδεχθεί την αφήγηση της ανεξέλεγκτης επιτάχυνσης. Πρέπει να απαιτήσει καλύτερη επιστήμη, καλύτερη τεκμηρίωση και καλύτερους θεσμούς.
Προς αξιόπιστη ενσωμάτωση εμπειριών
Η απάντηση δεν είναι να εγκαταλείψουμε τους agents ή τη μνήμη. Είναι να σχεδιάσουμε πιο αξιόπιστους τρόπους ενσωμάτωσης εμπειριών. Πρώτον, οι εμπειρίες δεν πρέπει να συμπυκνώνονται μόνο για οικονομία χώρου. Πρέπει να διατηρούν το πλαίσιο, τις συνθήκες ισχύος, τις αποτυχίες, τις εξαιρέσεις και τους λόγους για τους οποίους μια στρατηγική λειτούργησε. Δεύτερον, η μνήμη δεν πρέπει να προστίθεται μηχανικά στην αρχή κάθε προτροπής. Πρέπει να ενεργοποιείται δυναμικά, όταν το πρόβλημα το απαιτεί και όταν υπάρχει σαφής ένδειξη ότι η προηγούμενη εμπειρία είναι σχετική. Τρίτον, κάθε χρήση εμπειρίας σε κρίσιμα συστήματα πρέπει να συνοδεύεται από ίχνος ελέγχου: ποια εμπειρία ανακτήθηκε, γιατί θεωρήθηκε σχετική, πώς επηρέασε την απάντηση και αν υπήρχε ανθρώπινη εποπτεία.
Για χώρες όπως η Ελλάδα, αυτό συνδέεται άμεσα με τη στρατηγική της δημόσιας ΤΝ. Αν τα συστήματα που θα χρησιμοποιούνται στη διοίκηση, στην εκπαίδευση, στην υγεία ή στη δικαιοσύνη βασίζονται σε κλειστά μοντέλα και αδιαφανείς μηχανισμούς μνήμης, η κοινωνία δεν θα μπορεί να ελέγξει αν η εμπειρία αξιοποιείται ή απλώς προβάλλεται ως τεχνικό πρόσχημα. Αντίθετα, μια ανοιχτή δημόσια υποδομή ΤΝ, με ανοικτά πρότυπα, τεκμηριωμένα σύνολα δεδομένων, model cards, datasheets, RAG με επαληθεύσιμες πηγές και ανθρώπινη τελική ευθύνη, μπορεί να μετατρέψει την εμπειρία σε ελέγξιμη δημόσια γνώση.
Η πραγματική πρόοδος δεν βρίσκεται στον μύθο μιας μηχανής που αυτοβελτιώνεται ανεξάρτητα από την κοινωνία. Βρίσκεται στη δημιουργία συστημάτων που μαθαίνουν με διαφάνεια, σέβονται το πλαίσιο, αναγνωρίζουν τα όριά τους και λογοδοτούν. Η αυτο-εξέλιξη των LLMs, αν υπάρξει με σοβαρούς όρους, δεν θα είναι μαγικό άλμα. Θα είναι θεσμικά, τεχνικά και επιστημονικά ελεγχόμενη διαδικασία.
Πηγές άρθρου:
- Zhao et al., “Large Language Model Agents Are Not Always Faithful Self-Evolvers”: Η βασική εργασία τεκμηριώνει ότι οι agents αξιοποιούν κυρίως τις ακατέργαστες εμπειρίες, ενώ συχνά αγνοούν ή παρερμηνεύουν τις συμπυκνωμένες εμπειρίες, ακόμη και όταν αυτές είναι οι μόνες διαθέσιμες: https://arxiv.org/html/2601.22436v3.
- GlossAPI, “Η Τεχνητή Νοημοσύνη ως υποδομή κυριαρχίας”: Το άρθρο δίνει το πολιτικό πλαίσιο της ανάλυσης, συνδέοντας τον μύθο της αυτοβελτιούμενης ΤΝ με τη συγκέντρωση υπολογιστικής ισχύος, δεδομένων και κρατικής εξουσίας, και προτείνοντας δημόσια, ανοικτή και λογοδοτούσα υποδομή ΤΝ: https://blog.glossapi.gr/.
- Zhao et al., “ExpeL: LLM Agents Are Experiential Learners”: Η εργασία εισάγει ένα από τα βασικά παραδείγματα agent που συλλέγει εμπειρίες, εξάγει γλωσσικά διδάγματα και τα χρησιμοποιεί ως παραδείγματα κατά την εκτέλεση νέων εργασιών: https://arxiv.org/abs/2308.10144.
- Ouyang et al., “ReasoningBank: Scaling Agent Self-Evolving with Reasoning Memory”: Η εργασία είναι σημαντική επειδή προτείνει μνήμη συλλογισμού που συμπυκνώνει επιτυχίες και αποτυχίες agents, άρα βρίσκεται ακριβώς στο επίκεντρο της συζήτησης για τα όρια της συμπυκνωμένης εμπειρίας: https://arxiv.org/abs/2509.25140.
- Hu et al., “Memory in the Age of AI Agents”: Χρήσιμο εννοιολογικό πλαίσιο για τη μνήμη των agents, διακρίνοντας μορφές, λειτουργίες και δυναμικές της μνήμης και δείχνοντας γιατί η μνήμη πρέπει να αντιμετωπίζεται ως δομικό στοιχείο και όχι ως απλό πρόσθετο: https://arxiv.org/abs/2512.13564.
- Mitchell et al., “Model Cards for Model Reporting”: Εργασία για την ανάγκη διαφανούς τεκμηρίωσης των μοντέλων, ώστε η χρήση τους σε κρίσιμα πεδία να συνοδεύεται από πληροφορίες για επιδόσεις, περιορισμούς, συνθήκες αξιολόγησης και κατάλληλες χρήσεις: https://arxiv.org/abs/1810.03993.
- Gebru et al., “Datasheets for Datasets”: Η εργασία προτείνει τεκμηρίωση για τα σύνολα δεδομένων, κάτι κρίσιμο για συστήματα ΤΝ που βασίζονται σε εμπειρίες, μνήμες και ανακτώμενη γνώση, ιδίως όταν χρησιμοποιούνται σε δημόσιες υπηρεσίες: https://arxiv.org/abs/1803.09010.
- European Commission, “General-Purpose AI Models in the AI Act”: Το ευρωπαϊκό πλαίσιο υποχρεώσεων για μοντέλα γενικού σκοπού, με έμφαση στη διαφάνεια, στην τεκμηρίωση και στον έλεγχο του κύκλου ζωής των μοντέλων: https://digital-strategy.ec.europa.eu/en/faqs/general-purpose-ai-models-ai-act-questions-answers.