Οmnilingual ASR και η νέα εποχή στην αναγνώριση ομιλίας για όλες τις γλώσσες του κόσμου

Η πρόκληση των χιλιάδων γλωσσών που έμεναν εκτός Η αυτόματη αναγνώριση ομιλίας έχει εξελιχθεί εντυπωσιακά την τελευταία δεκαετία, όμως τα οφέλη αυτά περιορίζονταν κυρίως σε λίγες γλώσσες με πλούσιους πόρους. Χιλιάδες γλώσσες χαμηλών πόρων, πολλές… Οmnilingual ASR και η νέα εποχή στην αναγνώριση ομιλίας για όλες τις γλώσσες του κόσμου

Τεχνητή Νοημοσύνη στην Ελλάδα, μεγάλη φιλοδοξία, μικρή ψηφιακή ανεξαρτησία

Ένα φιλόδοξο σχέδιο με σιωπηλές παραδοχές Ο πρόσφατος «Οδικός Χάρτης για τον Μετασχηματισμό της Τεχνητής Νοημοσύνης στην Ελλάδα» παρουσιάζεται ως η αρχή μιας εθνικής στρατηγικής που σέβεται την ανθρώπινη αξιοπρέπεια, τη δημοκρατία, τη διαφάνεια και… Τεχνητή Νοημοσύνη στην Ελλάδα, μεγάλη φιλοδοξία, μικρή ψηφιακή ανεξαρτησία

Academic Knowledge Corpus

Περίληψη Το παρόν σύνολο δεδομένων αποτελεί ένα υψηλής ποιότητας σώμα κειμένων, το οποίο προέρχεται από ελληνικές διδακτορικές διατριβές και συνοδεύεται από εκαστοτε μεταδεδομένα. Το dataset περιλαμβάνει 55.423 εγγραφές που καλύπτουν την περίοδο 1975–2025, αντιπροσωπεύοντας το… Academic Knowledge Corpus

Σφυρηλατώντας τα GEMs: Νέα Μοντέλα για την Προώθηση της Επεξεργασίας Φυσικής Γλώσσας στα Ελληνικά

Η Επεξεργασία Φυσικής Γλώσσας για τη Νέα Ελληνική παραμένει μια πρόκληση, λόγω της μορφολογικής πολυπλοκότητας της γλώσσας και της περιορισμένης διαθεσιμότητας ποιοτικών δεδομένων. Το πρόβλημα γίνεται ιδιαίτερα εμφανές σε απαιτητικούς τομείς, όπως το νομικό κείμενο,… Σφυρηλατώντας τα GEMs: Νέα Μοντέλα για την Προώθηση της Επεξεργασίας Φυσικής Γλώσσας στα Ελληνικά

Γιατί τα Δεδομένα Εκπαίδευσης των LLMs Πρέπει να Θεωρούνται Κοινό Αγαθό

Η Τεχνητή Νοημοσύνη ως Δημόσιο Αγαθό Στην εποχή των μεγάλων γλωσσικών μοντέλων (LLMs) και των εφαρμογών Τεχνητής Νοημοσύνης που επηρεάζουν κάθε πτυχή της κοινωνίας, η πρόσβαση σε ποιοτικά, αντιπροσωπευτικά και δεοντολογικά διοικούμενα δεδομένα αποτελεί κρίσιμο… Γιατί τα Δεδομένα Εκπαίδευσης των LLMs Πρέπει να Θεωρούνται Κοινό Αγαθό

Αναγνώριση αυθόρμητης ομιλίας: Η νέα πρωτοβουλία της Mozilla για λιγότερο υποστηριζόμενες γλώσσες

Μια νέα εποχή για τα συστήματα αναγνώρισης ομιλίας Η αναγνώριση ομιλίας έχει βελτιωθεί εντυπωσιακά, όμως τα περισσότερα συστήματα συνεχίζουν να εκπαιδεύονται σε καθαρή, προσεκτικά διαβασμένη ομιλία. Αυτό δημιουργεί ένα χάσμα ανάμεσα στα μοντέλα και την… Αναγνώριση αυθόρμητης ομιλίας: Η νέα πρωτοβουλία της Mozilla για λιγότερο υποστηριζόμενες γλώσσες

Προς “AI-Ready” Δεδομένα: Η Νέα Εποχή στη Διακυβέρνηση της Πληροφορίας

Το Νέο Στάδιο Εξέλιξης των Δεδομένων Η ραγδαία πρόοδος της Τεχνητής Νοημοσύνης (ΤΝ) έχει οδηγήσει τα δεδομένα σε ένα κρίσιμο νέο σημείο καμπής: τη μετάβασή τους σε AI-ready δεδομένα, δεδομένα πλήρως ανιχνεύσιμα, κατανοητά, προσβάσιμα και… Προς “AI-Ready” Δεδομένα: Η Νέα Εποχή στη Διακυβέρνηση της Πληροφορίας

GlossAPI: Αναπτύσσοντας το Ελληνικό Data Set για την Εκπαίδευση Μεγάλων Γλωσσικών Μοντέλων

Η ταχεία διάδοση των Μεγάλων Γλωσσικών Μοντέλων (Large Language Models – LLMs), έχει δημιουργήσει μια πρωτοφανή ανάγκη για εκτεταμένα και υψηλής ποιότητας γλωσσικά δεδομένα. Για την ελληνική γλώσσα, η οποία διαθέτει μοναδικό ιστορικό βάθος, πολυπλοκότητα… GlossAPI: Αναπτύσσοντας το Ελληνικό Data Set για την Εκπαίδευση Μεγάλων Γλωσσικών Μοντέλων

Πώς επεξεργαζόμαστε δεδομένα

Η ποιότητα των δεδομένων Στον δημόσιο διάλογο για την Τεχνητή Νοημοσύνη, τα περισσότερα βλέμματα στρέφονται στα εντυπωσιακά αποτελέσματα των μεγάλων μοντέλων. Ωστόσο, η ουσία βρίσκεται στα δεδομένα που τροφοδοτούν αυτά τα συστήματα. Η ποιότητα των… Πώς επεξεργαζόμαστε δεδομένα

ALIA: Η Ισπανία Ανοίγει τα Γλωσσικά της Μοντέλα Τεχνητής Νοημοσύνης

Δημόσια Υποδομή ΤΝ για Όλες τις Επίσημες Γλώσσες της Ισπανίας Η Ισπανική κυβέρνηση ανακοίνωσε επίσημα την ανοιχτή διάθεση των γλωσσικών της μοντέλων ALIA, ενός φιλόδοξου έργου δημόσιας τεχνητής νοημοσύνης που υποστηρίζει όλες τις επίσημες και… ALIA: Η Ισπανία Ανοίγει τα Γλωσσικά της Μοντέλα Τεχνητής Νοημοσύνης

Pharos: Το Ελληνικό AI Factory για την Επιτάχυνση της Καινοτομίας στην Τεχνητή Νοημοσύνη

Ένα ελληνικό AI Factory στην καρδιά της ευρωπαϊκής στρατηγικής Το Pharos: The Greek AI Factory for Accelerating AI Innovation είναι μια φιλόδοξη πρωτοβουλία που στοχεύει να δημιουργήσει ένα EU AI Factory στην Ελλάδα, αξιοποιώντας στρατηγικά… Pharos: Το Ελληνικό AI Factory για την Επιτάχυνση της Καινοτομίας στην Τεχνητή Νοημοσύνη

GR-NLP-TOOLKIT: Ανοιχτό εργαλείο NLP για τα Νέα Ελληνικά

Γιατί χρειαζόμαστε ένα ελληνικό NLP toolkit; Τα Νέα Ελληνικά είναι η επίσημη γλώσσα της Ελλάδας, μία από τις δύο επίσημες γλώσσες της Κύπρου και η μητρική γλώσσα περίπου 13 εκατομμυρίων ανθρώπων. Παρ’ όλα αυτά, σε… GR-NLP-TOOLKIT: Ανοιχτό εργαλείο NLP για τα Νέα Ελληνικά