glossAPI – blog

Μετά το «Scale is all you need»: Πώς φανταζόμαστε μια λιγότερο ενεργοβόρα και πιο ανθρώπινη Τεχνητή Νοημοσύνη

από ellak-editor

Το τέλος μιας υπόσχεσης Για σχεδόν μια δεκαετία η κυρίαρχη ιδέα στην Τεχνητή Νοημοσύνη ήταν ότι «αρκεί να μεγαλώνουμε τα μοντέλα». Περισσότερα δεδομένα, περισσότερη υπολογιστική ισχύς, περισσότερες παράμετροι θεωρήθηκαν ο γρήγορος δρόμος προς τη γενική… Μετά το «Scale is all you need»: Πώς φανταζόμαστε μια λιγότερο ενεργοβόρα και πιο ανθρώπινη Τεχνητή Νοημοσύνη

Συνθετικά δεδομένα, πραγματικός κίνδυνος: γιατί η Τεχνητή Νοημοσύνη χρειάζεται ανοιχτά και τεκμηριωμένα δεδομένα

από ellak-editor

Μια υπόσχεση που κρύβει παγίδες Τα συνθετικά δεδομένα εμφανίζονται ως θαυματουργή λύση σε τρία μεγάλα προβλήματα της Τεχνητής Νοημοσύνης: την έλλειψη δεδομένων, την αδικία στα σύνολα εκπαίδευσης και την προστασία της ιδιωτικότητας. Παράλληλα, παρουσιάζονται ως… Συνθετικά δεδομένα, πραγματικός κίνδυνος: γιατί η Τεχνητή Νοημοσύνη χρειάζεται ανοιχτά και τεκμηριωμένα δεδομένα

Apertus AI: Ένα πλήρως ανοιχτό πολύγλωσσο μοντέλο για τοπική και εξειδικευμένη ανάπτυξη

από glossapiadmin

Το Apertus AI αποτελεί μια από τις πιο ολοκληρωμένες και διαφανείς προσπάθειες ανάπτυξης μεγάλων γλωσσικών μοντέλων ανοιχτού κώδικα. Η ερευνητική ομάδα της Ελβετίας το διαθέτει με πλήρη πρόσβαση στον πηγαίο κώδικα, στα βάρη εκπαίδευσης και… Apertus AI: Ένα πλήρως ανοιχτό πολύγλωσσο μοντέλο για τοπική και εξειδικευμένη ανάπτυξη

Προς ένα πλήρως ανοιχτό ελληνικό LLM: Η ανάγκη για ένα ενιαίο μοντέλο που καλύπτει τρεις χιλιετίες ελληνικής γλώσσας

από glossapiadmin

Η παγκόσμια δυναμική που διαμορφώνεται γύρω από τα πλήρως ανοιχτά μεγάλα γλωσσικά μοντέλα δημιουργεί μια ιστορική ευκαιρία για την Ελλάδα. Τα τελευταία δύο χρόνια, η διεθνής επιστημονική κοινότητα απέδειξε ότι μπορούν να κατασκευαστούν κορυφαία LLMs… Προς ένα πλήρως ανοιχτό ελληνικό LLM: Η ανάγκη για ένα ενιαίο μοντέλο που καλύπτει τρεις χιλιετίες ελληνικής γλώσσας

Data Union Strategy: Γιατί η Ευρώπη χρειάζεται ανθρώπινη, όχι μόνο βιομηχανική, οικονομία δεδομένων

από glossapiadmin

Πέρα από την πρόσβαση στα δεδομένα: ποιος ωφελείται πραγματικά; Η Data Union Strategy της Ευρωπαϊκής Επιτροπής σηματοδοτεί μια φιλόδοξη προσπάθεια ενίσχυσης της ευρωπαϊκής οικονομίας δεδομένων, απλοποίησης του ρυθμιστικού πλαισίου και ενίσχυσης της διεθνούς παρουσίας της… Data Union Strategy: Γιατί η Ευρώπη χρειάζεται ανθρώπινη, όχι μόνο βιομηχανική, οικονομία δεδομένων

GRDD+: Ένα εκτεταμένο γλωσσικό σύνολο ελληνικών διαλέκτων στην εποχή των LLMs

από glossapiadmin

Όταν τα LLMs συναντούν τις διαλέκτους Η σύγχρονη ελληνική δεν είναι μια ενιαία, ομοιογενής γλώσσα. Από την Κρήτη και την Κύπρο μέχρι τα Ποντιακά, τα Επτανησιακά και την Τσακωνική, ο ελληνικός χώρος χαρακτηρίζεται από πλούσια… GRDD+: Ένα εκτεταμένο γλωσσικό σύνολο ελληνικών διαλέκτων στην εποχή των LLMs

Οmnilingual ASR και η νέα εποχή στην αναγνώριση ομιλίας για όλες τις γλώσσες του κόσμου

από glossapiadmin

Η πρόκληση των χιλιάδων γλωσσών που έμεναν εκτός Η αυτόματη αναγνώριση ομιλίας έχει εξελιχθεί εντυπωσιακά την τελευταία δεκαετία, όμως τα οφέλη αυτά περιορίζονταν κυρίως σε λίγες γλώσσες με πλούσιους πόρους. Χιλιάδες γλώσσες χαμηλών πόρων, πολλές… Οmnilingual ASR και η νέα εποχή στην αναγνώριση ομιλίας για όλες τις γλώσσες του κόσμου

Τεχνητή Νοημοσύνη στην Ελλάδα, μεγάλη φιλοδοξία, μικρή ψηφιακή ανεξαρτησία

από glossapiadmin

Ένα φιλόδοξο σχέδιο με σιωπηλές παραδοχές Ο πρόσφατος «Οδικός Χάρτης για τον Μετασχηματισμό της Τεχνητής Νοημοσύνης στην Ελλάδα» παρουσιάζεται ως η αρχή μιας εθνικής στρατηγικής που σέβεται την ανθρώπινη αξιοπρέπεια, τη δημοκρατία, τη διαφάνεια και… Τεχνητή Νοημοσύνη στην Ελλάδα, μεγάλη φιλοδοξία, μικρή ψηφιακή ανεξαρτησία

Η Δημιουργία Academic Knowledge Corpus

από glossapiadmin

Περίληψη Το παρόν σύνολο δεδομένων αποτελεί ένα υψηλής ποιότητας σώμα κειμένων, το οποίο προέρχεται από ελληνικές διδακτορικές διατριβές και συνοδεύεται από εκαστοτε μεταδεδομένα. Το dataset περιλαμβάνει 55.423 εγγραφές που καλύπτουν την περίοδο 1975–2025, αντιπροσωπεύοντας το… Η Δημιουργία Academic Knowledge Corpus

Σφυρηλατώντας τα GEMs: Νέα Μοντέλα για την Προώθηση της Επεξεργασίας Φυσικής Γλώσσας στα Ελληνικά

από glossapiadmin

Η Επεξεργασία Φυσικής Γλώσσας για τη Νέα Ελληνική παραμένει μια πρόκληση, λόγω της μορφολογικής πολυπλοκότητας της γλώσσας και της περιορισμένης διαθεσιμότητας ποιοτικών δεδομένων. Το πρόβλημα γίνεται ιδιαίτερα εμφανές σε απαιτητικούς τομείς, όπως το νομικό κείμενο,… Σφυρηλατώντας τα GEMs: Νέα Μοντέλα για την Προώθηση της Επεξεργασίας Φυσικής Γλώσσας στα Ελληνικά

Γιατί τα Δεδομένα Εκπαίδευσης των LLMs Πρέπει να Θεωρούνται Κοινό Αγαθό

από glossapiadmin

Η Τεχνητή Νοημοσύνη ως Δημόσιο Αγαθό Στην εποχή των μεγάλων γλωσσικών μοντέλων (LLMs) και των εφαρμογών Τεχνητής Νοημοσύνης που επηρεάζουν κάθε πτυχή της κοινωνίας, η πρόσβαση σε ποιοτικά, αντιπροσωπευτικά και δεοντολογικά διοικούμενα δεδομένα αποτελεί κρίσιμο… Γιατί τα Δεδομένα Εκπαίδευσης των LLMs Πρέπει να Θεωρούνται Κοινό Αγαθό

Αναγνώριση αυθόρμητης ομιλίας: Η νέα πρωτοβουλία της Mozilla για λιγότερο υποστηριζόμενες γλώσσες

από glossapiadmin

Μια νέα εποχή για τα συστήματα αναγνώρισης ομιλίας Η αναγνώριση ομιλίας έχει βελτιωθεί εντυπωσιακά, όμως τα περισσότερα συστήματα συνεχίζουν να εκπαιδεύονται σε καθαρή, προσεκτικά διαβασμένη ομιλία. Αυτό δημιουργεί ένα χάσμα ανάμεσα στα μοντέλα και την… Αναγνώριση αυθόρμητης ομιλίας: Η νέα πρωτοβουλία της Mozilla για λιγότερο υποστηριζόμενες γλώσσες