Μετά το «Scale is all you need»: Πώς φανταζόμαστε μια λιγότερο ενεργοβόρα και πιο ανθρώπινη Τεχνητή Νοημοσύνη

Το τέλος μιας υπόσχεσης Για σχεδόν μια δεκαετία η κυρίαρχη ιδέα στην Τεχνητή Νοημοσύνη ήταν ότι «αρκεί να μεγαλώνουμε τα μοντέλα». Περισσότερα δεδομένα, περισσότερη υπολογιστική ισχύς, περισσότερες παράμετροι θεωρήθηκαν ο γρήγορος δρόμος προς τη γενική… Μετά το «Scale is all you need»: Πώς φανταζόμαστε μια λιγότερο ενεργοβόρα και πιο ανθρώπινη Τεχνητή Νοημοσύνη

Συνθετικά δεδομένα, πραγματικός κίνδυνος: γιατί η Τεχνητή Νοημοσύνη χρειάζεται ανοιχτά και τεκμηριωμένα δεδομένα

Μια υπόσχεση που κρύβει παγίδες Τα συνθετικά δεδομένα εμφανίζονται ως θαυματουργή λύση σε τρία μεγάλα προβλήματα της Τεχνητής Νοημοσύνης: την έλλειψη δεδομένων, την αδικία στα σύνολα εκπαίδευσης και την προστασία της ιδιωτικότητας. Παράλληλα, παρουσιάζονται ως… Συνθετικά δεδομένα, πραγματικός κίνδυνος: γιατί η Τεχνητή Νοημοσύνη χρειάζεται ανοιχτά και τεκμηριωμένα δεδομένα

Apertus AI: Ένα πλήρως ανοιχτό πολύγλωσσο μοντέλο για τοπική και εξειδικευμένη ανάπτυξη

Το Apertus AI αποτελεί μια από τις πιο ολοκληρωμένες και διαφανείς προσπάθειες ανάπτυξης μεγάλων γλωσσικών μοντέλων ανοιχτού κώδικα. Η ερευνητική ομάδα της Ελβετίας το διαθέτει με πλήρη πρόσβαση στον πηγαίο κώδικα, στα βάρη εκπαίδευσης και… Apertus AI: Ένα πλήρως ανοιχτό πολύγλωσσο μοντέλο για τοπική και εξειδικευμένη ανάπτυξη

Προς ένα πλήρως ανοιχτό ελληνικό LLM: Η ανάγκη για ένα ενιαίο μοντέλο που καλύπτει τρεις χιλιετίες ελληνικής γλώσσας

Η παγκόσμια δυναμική που διαμορφώνεται γύρω από τα πλήρως ανοιχτά μεγάλα γλωσσικά μοντέλα δημιουργεί μια ιστορική ευκαιρία για την Ελλάδα. Τα τελευταία δύο χρόνια, η διεθνής επιστημονική κοινότητα απέδειξε ότι μπορούν να κατασκευαστούν κορυφαία LLMs… Προς ένα πλήρως ανοιχτό ελληνικό LLM: Η ανάγκη για ένα ενιαίο μοντέλο που καλύπτει τρεις χιλιετίες ελληνικής γλώσσας

Data Union Strategy: Γιατί η Ευρώπη χρειάζεται ανθρώπινη, όχι μόνο βιομηχανική, οικονομία δεδομένων

Πέρα από την πρόσβαση στα δεδομένα: ποιος ωφελείται πραγματικά; Η Data Union Strategy της Ευρωπαϊκής Επιτροπής σηματοδοτεί μια φιλόδοξη προσπάθεια ενίσχυσης της ευρωπαϊκής οικονομίας δεδομένων, απλοποίησης του ρυθμιστικού πλαισίου και ενίσχυσης της διεθνούς παρουσίας της… Data Union Strategy: Γιατί η Ευρώπη χρειάζεται ανθρώπινη, όχι μόνο βιομηχανική, οικονομία δεδομένων

GRDD+: Ένα εκτεταμένο γλωσσικό σύνολο ελληνικών διαλέκτων στην εποχή των LLMs

Όταν τα LLMs συναντούν τις διαλέκτους Η σύγχρονη ελληνική δεν είναι μια ενιαία, ομοιογενής γλώσσα. Από την Κρήτη και την Κύπρο μέχρι τα Ποντιακά, τα Επτανησιακά και την Τσακωνική, ο ελληνικός χώρος χαρακτηρίζεται από πλούσια… GRDD+: Ένα εκτεταμένο γλωσσικό σύνολο ελληνικών διαλέκτων στην εποχή των LLMs

Οmnilingual ASR και η νέα εποχή στην αναγνώριση ομιλίας για όλες τις γλώσσες του κόσμου

Η πρόκληση των χιλιάδων γλωσσών που έμεναν εκτός Η αυτόματη αναγνώριση ομιλίας έχει εξελιχθεί εντυπωσιακά την τελευταία δεκαετία, όμως τα οφέλη αυτά περιορίζονταν κυρίως σε λίγες γλώσσες με πλούσιους πόρους. Χιλιάδες γλώσσες χαμηλών πόρων, πολλές… Οmnilingual ASR και η νέα εποχή στην αναγνώριση ομιλίας για όλες τις γλώσσες του κόσμου

Τεχνητή Νοημοσύνη στην Ελλάδα, μεγάλη φιλοδοξία, μικρή ψηφιακή ανεξαρτησία

Ένα φιλόδοξο σχέδιο με σιωπηλές παραδοχές Ο πρόσφατος «Οδικός Χάρτης για τον Μετασχηματισμό της Τεχνητής Νοημοσύνης στην Ελλάδα» παρουσιάζεται ως η αρχή μιας εθνικής στρατηγικής που σέβεται την ανθρώπινη αξιοπρέπεια, τη δημοκρατία, τη διαφάνεια και… Τεχνητή Νοημοσύνη στην Ελλάδα, μεγάλη φιλοδοξία, μικρή ψηφιακή ανεξαρτησία

Η Δημιουργία Academic Knowledge Corpus

Περίληψη Το παρόν σύνολο δεδομένων αποτελεί ένα υψηλής ποιότητας σώμα κειμένων, το οποίο προέρχεται από ελληνικές διδακτορικές διατριβές και συνοδεύεται από εκαστοτε μεταδεδομένα. Το dataset περιλαμβάνει 55.423 εγγραφές που καλύπτουν την περίοδο 1975–2025, αντιπροσωπεύοντας το… Η Δημιουργία Academic Knowledge Corpus

Σφυρηλατώντας τα GEMs: Νέα Μοντέλα για την Προώθηση της Επεξεργασίας Φυσικής Γλώσσας στα Ελληνικά

Η Επεξεργασία Φυσικής Γλώσσας για τη Νέα Ελληνική παραμένει μια πρόκληση, λόγω της μορφολογικής πολυπλοκότητας της γλώσσας και της περιορισμένης διαθεσιμότητας ποιοτικών δεδομένων. Το πρόβλημα γίνεται ιδιαίτερα εμφανές σε απαιτητικούς τομείς, όπως το νομικό κείμενο,… Σφυρηλατώντας τα GEMs: Νέα Μοντέλα για την Προώθηση της Επεξεργασίας Φυσικής Γλώσσας στα Ελληνικά

Γιατί τα Δεδομένα Εκπαίδευσης των LLMs Πρέπει να Θεωρούνται Κοινό Αγαθό

Η Τεχνητή Νοημοσύνη ως Δημόσιο Αγαθό Στην εποχή των μεγάλων γλωσσικών μοντέλων (LLMs) και των εφαρμογών Τεχνητής Νοημοσύνης που επηρεάζουν κάθε πτυχή της κοινωνίας, η πρόσβαση σε ποιοτικά, αντιπροσωπευτικά και δεοντολογικά διοικούμενα δεδομένα αποτελεί κρίσιμο… Γιατί τα Δεδομένα Εκπαίδευσης των LLMs Πρέπει να Θεωρούνται Κοινό Αγαθό

Αναγνώριση αυθόρμητης ομιλίας: Η νέα πρωτοβουλία της Mozilla για λιγότερο υποστηριζόμενες γλώσσες

Μια νέα εποχή για τα συστήματα αναγνώρισης ομιλίας Η αναγνώριση ομιλίας έχει βελτιωθεί εντυπωσιακά, όμως τα περισσότερα συστήματα συνεχίζουν να εκπαιδεύονται σε καθαρή, προσεκτικά διαβασμένη ομιλία. Αυτό δημιουργεί ένα χάσμα ανάμεσα στα μοντέλα και την… Αναγνώριση αυθόρμητης ομιλίας: Η νέα πρωτοβουλία της Mozilla για λιγότερο υποστηριζόμενες γλώσσες