Από τον μύθο της υπερνοημοσύνης στα ανοιχτά, τοπικά και χαμηλού κόστους LLMs
Η δημόσια συζήτηση γύρω από την Τεχνητή Νοημοσύνη(TN) ταλαντεύεται ανάμεσα σε δύο άκρα. Από τη μία πλευρά, η ρητορική της επικείμενης υπερνοημοσύνης, όπως εκφράζεται από στελέχη της Anthropic και της OpenAI, που περιγράφουν ένα μέλλον όπου «ιδιοφυΐες» λειτουργούν σε μεγάλα υπολογιστικά κέντρα. Από την άλλη, ο πλήρης απομυθοποιητικός λόγος που αντιμετωπίζει τα μεγάλα γλωσσικά μοντέλα ως απλούς «στοχαστικούς παπαγάλους». Η πραγματικότητα, όπως αναδεικνύεται και από τη σύγχρονη έρευνα, βρίσκεται κάπου ενδιάμεσα και ακριβώς εκεί εντοπίζεται το πεδίο χάραξης πολιτικής.
Τα σύγχρονα Μεγάλα Γλωσσικά Μοντέλα(LLMs) δεν διαθέτουν εσωτερική ζωή ή συνείδηση. Ωστόσο, επιδεικνύουν μια λειτουργική κατανόηση του κόσμου μέσω συμπίεσης και αναπαράστασης γνώσης σε υψηλοδιάστατους χώρους. Η πρακτική εμπειρία προγραμματιστών και ερευνητών δείχνει ότι αυτά τα μοντέλα μπορούν να επιλύουν σύνθετα προβλήματα, να αναγνωρίζουν μοτίβα και να επιταχύνουν δραστικά τη γνώση-εντατική εργασία. Αυτό το γεγονός καθιστά την ΤΝ κρίσιμη υποδομή και όχι απλώς καταναλωτικό προϊόν.
Σε ερευνητικό επίπεδο, η προτεραιότητα πρέπει να μετατοπιστεί από το κυνήγι όλο και μεγαλύτερων μοντέλων προς την αποδοτικότητα, τη διαφάνεια και την ερμηνευσιμότητα. Η έρευνα σε αρχιτεκτονικές συμπίεσης, σε τεχνικές απόσταξης γνώσης(knowledge distillation) και σε μοντέλα που μαθαίνουν με λιγότερα δεδομένα είναι στρατηγικά σημαντικότερη από την κλιμάκωση κόστους και ενέργειας. Η πρόοδος ανοιχτών έργων όπως το DeepSeek δείχνει ότι η υψηλή απόδοση δεν είναι αποκλειστικό προνόμιο κλειστών οικοσυστημάτων.
Σε κρατικό επίπεδο, η ΤΝ πρέπει να αντιμετωπιστεί ως ψηφιακό δημόσιο αγαθό. Η υιοθέτηση χαμηλού κόστους, ανοιχτού λογισμικού τοπικά LLMs(low cost, fully open source local LLMs) επιτρέπει ψηφιακή κυριαρχία, συμμόρφωση με την προστασία δεδομένων και μείωση μακροπρόθεσμου κόστους. Δημόσιες διοικήσεις, πανεπιστήμια και νοσοκομεία μπορούν να λειτουργούν μοντέλα τοπικά(on premises) ή σε εθνικά υπολογιστικά νέφη(clouds), χωρίς εξάρτηση από εξωευρωπαϊκούς παρόχους. Παράλληλα, η δημόσια χρηματοδότηση οφείλει να κατευθύνεται σε ανοιχτά μοντέλα και κοινές υποδομές, ώστε τα αποτελέσματα της έρευνας να επαναχρησιμοποιούνται.
Σε επιχειρηματικό επίπεδο, το ανταγωνιστικό πλεονέκτημα δε θα προκύψει από την πρόσβαση σε κλειστά συστήματα, αλλά από τη βαθιά ενσωμάτωση ανοιχτών LLMs σε συγκεκριμένα πεδία εφαρμογών. Οι μικρομεσαίες επιχειρήσεις μπορούν να αναπτύξουν εξειδικευμένες λύσεις, αξιοποιώντας τοπικά μοντέλα προσαρμοσμένα στη γλώσσα, το νομικό πλαίσιο και τα δεδομένα τους. Αυτό μειώνει το κόστος, αυξάνει την αξιοπιστία και ενισχύει την καινοτομία.
Η Τεχνητή Νοημοσύνη δε χρειάζεται μεταφυσικές ερμηνείες για να είναι πολιτικά και οικονομικά κρίσιμη. Αρκεί να την προσεγγίσουμε ως τεχνολογία γενικού σκοπού, της οποίας η αξία μεγιστοποιείται όταν είναι ανοιχτή, ελέγξιμη και προσβάσιμη. Το μέλλον της ΤΝ δεν ανήκει αποκλειστικά στα γιγάντια υπολογιστικά κέντρα, αλλά σε εκείνους που θα επενδύσουν στη γνώση ως κοινό πόρο.
Πηγές:
- The Case That A.I. Is Thinking, The New Yorker. Εκτενής ανάλυση για κατανόηση και συμπίεση στα LLMs. https://www.newyorker.com/magazine/2025/11/10/the-case-that-ai-is-thinking
- Sparse Distributed Memory, Pentti Kanerva. Θεμελιώδες έργο για υψηλοδιάστατες αναπαραστάσεις. https://web.stanford.edu/~kanerva/sdm.html
- Deep Learning, Ian Goodfellow et al. Τεχνική θεμελίωση των σύγχρονων νευρωνικών δικτύων. https://www.deeplearningbook.org
- European Commission, Open Source Software Strategy 2020–2023. Πλαίσιο πολιτικής για τις ανοιχτές τεχνολογίες. https://commission.europa.eu/open-source-strategy