Από τον μύθο της υπερνοημοσύνης στα ανοιχτά, τοπικά και χαμηλού κόστους LLMs Η δημόσια συζήτηση γύρω από την Τεχνητή Νοημοσύνη(TN) ταλαντεύεται ανάμεσα σε δύο άκρα. Από τη μία πλευρά, η ρητορική της επικείμενης υπερνοημοσύνης, όπως εκφράζεται από στελέχη της Anthropic και της OpenAI, που περιγράφουν ένα μέλλον όπου «ιδιοφυΐες» λειτουργούν σε μεγάλα υπολογιστικά κέντρα. Από […]
Τα ευρωπαϊκά χαμηλού κόστους, ανοιχτού λογισμικού τοπικά μοντέλα ως ρεαλιστική στρατηγική Η συζήτηση γύρω από την Τεχνητή Νοημοσύνη κυριαρχείται από γιγαντιαία μοντέλα που απαιτούν τεράστιους πόρους, ενεργειακή κατανάλωση και εξάρτηση από λίγους παγκόσμιους παρόχους. Όπως έχει επισημάνει ο Gary Marcus, η συνεχής κλιμάκωση των Μεγάλων Γλωσσικών Μοντέλων(LLMs) οδηγεί σε φθίνουσες αποδόσεις, χωρίς να επιλύει τα […]
Από την αισθητική εντύπωση στη γνώση, τη διαφάνεια και τα ψηφιακά κοινά Τα τελευταία χρόνια, η δημιουργία εικόνων με Τεχνητή Νοημοσύνη(ΤΝ) έχει μετακινηθεί από τον πειραματισμό στην παραγωγική χρήση, επηρεάζοντας την εκπαίδευση, την έρευνα, τον πολιτισμό και τη βιομηχανία περιεχομένου. Σε αυτό το πεδίο, τα έργα ανοιχτού λογισμικού αποκτούν ιδιαίτερη σημασία, όχι μόνο επειδή προσφέρουν […]
Επιστημονικά μοντέλα και φιλοσοφικά όρια της τεχνητής συνείδησης Η ταχεία εξέλιξη της τεχνητής νοημοσύνης(ΤΝ), και ειδικά των μεγάλων γλωσσικών μοντέλων, έχει επαναφέρει ένα από τα παλαιότερα και δυσκολότερα ερωτήματα της φιλοσοφίας του νου: μπορεί μια μηχανή να έχει συνείδηση ή απλώς προσομοιώνει τη συμπεριφορά της; Το ερώτημα αυτό δεν είναι πλέον αμιγώς θεωρητικό, καθώς τα […]
Γιατί η ελληνική γλώσσα χρειάζεται μια εθνική και ευρωπαϊκή ανοικτή υποδομή δεδομένων Η εκπαίδευση μεγάλων γλωσσικών μοντέλων βασίζεται σε τεράστιους όγκους κειμένου, όμως η ποσότητα χωρίς καθαρή αδειοδότηση και τεκμηριωμένη προέλευση δημιουργεί νομική αβεβαιότητα, περιορισμένη επαναχρησιμοποίηση και χαμηλή επιστημονική αξιοπιστία. Το German Commons αποτελεί σημείο καμπής: 154,56 δισ. tokens, 41 πηγές, επτά θεματικοί τομείς, με […]
Όταν η γλωσσική ευφράδεια υποκαθιστά την κρίση και γιατί αυτό είναι πολιτικό ζήτημα Η ραγδαία διάδοση των μεγάλων γλωσσικών μοντέλων (LLMs) έχει δημιουργήσει την εντύπωση ότι βρισκόμαστε μπροστά σε μηχανές που “σκέφτονται”. Η εντύπωση αυτή δεν προκύπτει επειδή τα συστήματα αυτά κατανοούν τον κόσμο, αλλά επειδή παράγουν κείμενο που μοιάζει με ανθρώπινη κρίση. Το πρόσφατο […]
Ανοιχτά πρότυπα για τεκμηριωμένη γλωσσική γνώση Τα γλωσσικά σώματα κειμένων αποτελούν σήμερα κρίσιμη υποδομή για τη γλωσσολογία, την υπολογιστική ανάλυση φυσικής γλώσσας και τη σύγχρονη τεχνητή νοημοσύνη. Η έννοια του σώματος κειμένων δεν περιορίζεται σε μια απλή συλλογή δεδομένων, αλλά προϋποθέτει συνειδητό σχεδιασμό, επιλογή και δομή με συγκεκριμένα ερευνητικά κριτήρια. Σε αυτό το πλαίσιο, οι […]
Το τέλος μιας υπόσχεσης Για σχεδόν μια δεκαετία η κυρίαρχη ιδέα στην Τεχνητή Νοημοσύνη ήταν ότι «αρκεί να μεγαλώνουμε τα μοντέλα». Περισσότερα δεδομένα, περισσότερη υπολογιστική ισχύς, περισσότερες παράμετροι θεωρήθηκαν ο γρήγορος δρόμος προς τη γενική τεχνητή νοημοσύνη. Σήμερα όμως, ακόμη και σε κορυφαία συνέδρια, πληθαίνουν οι φωνές που επισημαίνουν ότι η αύξηση της κλίμακας φτάνει […]
Μια υπόσχεση που κρύβει παγίδες Τα συνθετικά δεδομένα εμφανίζονται ως θαυματουργή λύση σε τρία μεγάλα προβλήματα της Τεχνητής Νοημοσύνης: την έλλειψη δεδομένων, την αδικία στα σύνολα εκπαίδευσης και την προστασία της ιδιωτικότητας. Παράλληλα, παρουσιάζονται ως μέσο «δημοκρατικοποίησης» της ανάπτυξης ΤΝ, επειδή επιτρέπουν σε μικρότερους φορείς να παράγουν δεδομένα χωρίς πρόσβαση στα τεράστια αποθετήρια των τεχνολογικών […]
Το Apertus AI αποτελεί μια από τις πιο ολοκληρωμένες και διαφανείς προσπάθειες ανάπτυξης μεγάλων γλωσσικών μοντέλων ανοιχτού κώδικα. Η ερευνητική ομάδα της Ελβετίας το διαθέτει με πλήρη πρόσβαση στον πηγαίο κώδικα, στα βάρη εκπαίδευσης και στην τεκμηρίωση της διαδικασίας δημιουργίας του. Αυτή η προσέγγιση επιτρέπει σε οργανισμούς, δημόσιους φορείς και ερευνητές να αποκτήσουν πραγματικό τεχνολογικό […]
Η παγκόσμια δυναμική που διαμορφώνεται γύρω από τα πλήρως ανοιχτά μεγάλα γλωσσικά μοντέλα δημιουργεί μια ιστορική ευκαιρία για την Ελλάδα. Τα τελευταία δύο χρόνια, η διεθνής επιστημονική κοινότητα απέδειξε ότι μπορούν να κατασκευαστούν κορυφαία LLMs με απόλυτη διαφάνεια, δημόσια διαθέσιμα βάρη(weights), ανοιχτά δεδομένα εκπαίδευσης και αναλυτική τεκμηρίωση. Το Apertus, το OLMo και το BLOOM αποτελούν […]
Πέρα από την πρόσβαση στα δεδομένα: ποιος ωφελείται πραγματικά; Η Data Union Strategy της Ευρωπαϊκής Επιτροπής σηματοδοτεί μια φιλόδοξη προσπάθεια ενίσχυσης της ευρωπαϊκής οικονομίας δεδομένων, απλοποίησης του ρυθμιστικού πλαισίου και ενίσχυσης της διεθνούς παρουσίας της ΕΕ στον χώρο των παγκόσμιων ροών δεδομένων. Η στρατηγική δίνει έμφαση στην αύξηση της διαθεσιμότητας δεδομένων για την ανάπτυξη Τεχνητής […]