30 Μαΐου 2026

Πλέγματα δεδομένων: η υποδομή για χρήσιμη και αξιόπιστη δημόσια ΤΝ

Η συζήτηση για την τεχνητή νοημοσύνη συχνά ξεκινά από τα μοντέλα. Ποιο μοντέλο είναι πιο ισχυρό, πιο γρήγορο, πιο οικονομικό, πιο «έξυπνο». Όμως για τη δημόσια διοίκηση και για τις επιχειρήσεις το κρίσιμο ερώτημα είναι άλλο: με ποια δεδομένα σκέφτεται το μοντέλο, ποιος τα ελέγχει, πώς συνδέονται με τις πραγματικές διαδικασίες και με ποιον τρόπο τεκμηριώνεται κάθε απάντηση. Ένα τοπικό σύστημα τεχνητής νοημοσύνης ανοιχτού λογισμικού μπορεί να είναι φθηνό, ασφαλές και κυρίαρχο. Δεν θα είναι όμως χρήσιμο αν λειτουργεί πάνω σε κατακερματισμένα αρχεία, παλιά PDF, ασύνδετες βάσεις δεδομένων και διοικητικές διαδικασίες που δεν έχουν μετατραπεί σε μηχαναγνώσιμη γνώση.

Γι’ αυτό η κρίσιμη υποδομή δεν είναι μόνο το τοπικό μοντέλο. Είναι το πλέγμα δεδομένων. Με τον όρο αυτό δεν εννοούμε απλώς μια αποθήκη δεδομένων ούτε μια νέα κεντρική βάση όπου όλα αντιγράφονται. Εννοούμε ένα στρώμα διασύνδεσης, τεκμηρίωσης, σημασιολογίας και διακυβέρνησης που επιτρέπει σε διαφορετικά πληροφοριακά συστήματα να παραμένουν εκεί όπου βρίσκονται, αλλά να γίνονται κατανοητά, ελέγξιμα και αξιοποιήσιμα από εφαρμογές ΤΝ. Το πλέγμα δεδομένων συνδέει μητρώα, έγγραφα, διαδικασίες, πολιτικές, μεταδεδομένα, APIs και ιστορικά στοιχεία. Δεν μεταφέρει μόνο τιμές και πεδία. Μεταφέρει νόημα.

Στη δημόσια διοίκηση αυτό σημαίνει ότι ένα σύστημα ΤΝ δεν πρέπει να απαντά μόνο επειδή έχει «διαβάσει» γενικά ελληνικά κείμενα. Πρέπει να μπορεί να ανατρέχει στο ΦΕΚ, στη σχετική εγκύκλιο, στο mitos.gov.gr, στο gov.gr, στη Διαύγεια, στο ΚΗΜΔΗΣ, στο ΕΣΗΔΗΣ, στα μητρώα πολιτών και επιχειρήσεων, στα συστήματα της ΑΑΔΕ, στο myDATA, στο ΕΡΓΑΝΗ, στον e-ΕΦΚΑ, στην ΗΔΙΚΑ, στην ηλεκτρονική συνταγογράφηση, στα συστήματα των ΚΕΠ, στο Κτηματολόγιο, στην e-Άδειες, στα δεδομένα δήμων και περιφερειών, στα γεωχωρικά δεδομένα, στα στοιχεία πολιτικής προστασίας και στα ανοικτά δεδομένα της ΕΛΣΤΑΤ. Όχι για να εκδίδει αυτόματα αποφάσεις, αλλά για να βοηθά τους υπαλλήλους και τους πολίτες να βρίσκουν τη σωστή διαδικασία, να εντοπίζουν λάθη, να συμπληρώνουν αιτήσεις, να ελέγχουν προθεσμίες και να τεκμηριώνουν επιλογές.

Ένα τέτοιο πλέγμα θα μπορούσε να ξεκινήσει από τέσσερις κατηγορίες δεδομένων. Πρώτο, το διοικητικό πλέγμα, με ΦΕΚ, εγκυκλίους, αποφάσεις, διαδικασίες, αρμοδιότητες, μητρώα και πρότυπα εγγράφων. Δεύτερο, το οικονομικό πλέγμα, με προϋπολογισμούς, προμήθειες, συμβάσεις, πληρωμές, έργα, ενισχύσεις και δείκτες αποδοτικότητας. Τρίτο, το κοινωνικό πλέγμα, με ασφαλιστικές, υγειονομικές, εκπαιδευτικές και προνοιακές υπηρεσίες, πάντα με αυστηρή προστασία προσωπικών δεδομένων. Τέταρτο, το χωρικό και περιβαλλοντικό πλέγμα, με γεωχωρικά δεδομένα, χρήσεις γης, δασικούς χάρτες, δεδομένα πλημμύρας, πυρκαγιάς, ατμοσφαιρικής ρύπανσης, μεταφορών και υποδομών.

Για τις επιχειρήσεις, η λογική είναι αντίστοιχη. Ένα τοπικό ανοιχτό LLM δεν αποκτά αξία επειδή απαντά γενικά σε ερωτήσεις. Αποκτά αξία όταν συνδέεται με ERP, CRM, συστήματα αποθήκης, εφοδιαστικής αλυσίδας, τιμολόγησης, λογιστηρίου, HR, helpdesk, POS, e-commerce, παραγωγής, ποιότητας, συντήρησης, συμβάσεων και εσωτερικών πολιτικών. Έτσι μπορεί να υποστηρίζει προβλέψεις ζήτησης, έλεγχο αποθεμάτων, ανάλυση πελατειακών αιτημάτων, εντοπισμό αποκλίσεων σε παραγγελίες, αξιολόγηση κινδύνων προμηθευτών και σύνταξη εσωτερικών αναφορών. Η επιχείρηση δεν χρειάζεται ένα «έξυπνο chatbot» αποκομμένο από τη λειτουργία της. Χρειάζεται ένα ασφαλές σύστημα που καταλαβαίνει το δικό της πλαίσιο.

Το κρίσιμο τεχνικό σχήμα είναι η ανάκτηση τεκμηρίων πριν από την απάντηση. Τα συστήματα Retrieval-Augmented Generation(RAG) μειώνουν τις παραισθήσεις επειδή το μοντέλο δεν απαντά μόνο από τη μνήμη του. Αναζητά πρώτα στα έγκυρα τεκμήρια του οργανισμού, ανακτά το σχετικό απόσπασμα και στη συνέχεια συνθέτει απάντηση με βάση αυτό. Για τη δημόσια διοίκηση αυτό πρέπει να είναι αδιαπραγμάτευτος κανόνας: καμία απάντηση για δικαίωμα, υποχρέωση, φόρο, άδεια, επίδομα, σύμβαση ή προθεσμία χωρίς αναφορά σε θεσμική πηγή. Για τις επιχειρήσεις σημαίνει ότι κάθε κρίσιμη σύσταση πρέπει να πατά σε πραγματικά δεδομένα, πολιτικές, συμβάσεις και εγκεκριμένα έγγραφα.

Εδώ βρίσκεται η ιδιαίτερη σημασία του GlossAPI. Η ελληνική γλώσσα δεν μπορεί να αντιμετωπίζεται ως δευτερεύον παράρτημα των αγγλόφωνων μοντέλων. Χρειάζεται τεκμηριωμένα, καθαρά, ανοιχτά και επαναχρησιμοποιήσιμα ελληνικά δεδομένα. Το GlossAPI λειτουργεί ως αγωγός μετατροπής ελληνικών κειμένων σε AI-ready σύνολα δεδομένων, με καθαρισμό, τυποποίηση, τεκμηρίωση και ανοιχτές άδειες. Αυτό το καθιστά κρίσιμο κρίκο ανάμεσα στα τοπικά ανοιχτά μοντέλα και στην πραγματική ελληνική δημόσια γνώση. Μπορεί να τροφοδοτήσει RAG συστήματα για νομοθεσία, δημόσιες διαβουλεύσεις, εκπαιδευτικό περιεχόμενο, πολιτιστικά τεκμήρια, διοικητικά έγγραφα και γλωσσικά σώματα.

Η πολιτική σημασία είναι σαφής. Αν η ΤΝ στη δημόσια διοίκηση χτιστεί πάνω σε κλειστά υπολογιστικά συστήματα(cloud) και ιδιωτικά δεδομένα, το κράτος θα γίνει ακόμη πιο εξαρτημένο. Αν χτιστεί πάνω σε τοπικά ανοιχτά μοντέλα, δημόσια ελεγχόμενες υποδομές, ανοιχτά APIs, τεκμηριωμένα δεδομένα και πλέγματα γνώσης, μπορεί να γίνει εργαλείο δημοκρατικού εκσυγχρονισμού. Το ζητούμενο δεν είναι η αυτοματοποίηση της εξουσίας. Είναι η ενίσχυση της ανθρώπινης κρίσης, της διαφάνειας και της λογοδοσίας.

Το πλέγμα δεδομένων είναι η υποδομή που επιτρέπει στην ΤΝ να πάψει να είναι εντυπωσιακή επίδειξη και να γίνει αξιόπιστη δημόσια υπηρεσία. Χωρίς αυτό, η ΤΝ θα παράγει γρήγορες απαντήσεις με αβέβαιη αξία. Με αυτό, μπορεί να παράγει τεκμηριωμένη γνώση, καλύτερες αποφάσεις και πραγματική δημόσια αξία.

Πηγές:

MIT Technology Review Insights, “AI needs a strong data fabric to deliver business value”: Το άρθρο τεκμηριώνει ότι η επιχειρησιακή αξία της ΤΝ εξαρτάται από την ποιότητα, τη σημασιολογία και το πλαίσιο των δεδομένων, όχι μόνο από την ισχύ του μοντέλου: https://www.technologyreview.com/2026/04/22/1135295/ai-needs-a-strong-data-fabric-to-deliver-business-value/,

GlossAPI, “Greek Datasets”: Το GlossAPI παρουσιάζεται ως αγωγός για την επεξεργασία ελληνικών κειμένων και τη μετατροπή τους σε AI-ready σύνολα δεδομένων για μεγάλα γλωσσικά μοντέλα, με δημόσια διαθέσιμα ελληνικά corpora: https://glossapi.gr/,

GlossAPI, “About”: Η σελίδα τεκμηριώνει ότι το GlossAPI είναι ανοιχτού κώδικα βιβλιοθήκη Python και τεχνική υποδομή για τη δημιουργία, επεξεργασία και δημοσίευση ελληνικών AI-ready δεδομένων με ανοιχτές άδειες: https://glossapi.gr/aboutus.html,

UK Government, “AI Insights: RAG Systems”: Τεκμηρίωση που εξηγεί γιατί τα RAG συστήματα μειώνουν τις παραισθήσεις, γειώνοντας τις απαντήσεις σε έγκυρες πηγές γνώσης: https://www.gov.uk/government/publications/ai-insights/ai-insights-rag-systems-html,

European Commission, “Common European Data Spaces”: Η Ευρωπαϊκή Επιτροπή περιγράφει τους ευρωπαϊκούς χώρους δεδομένων ως ασφαλή και αξιόπιστο πλαίσιο ανταλλαγής δεδομένων για επιχειρήσεις, δημόσιες διοικήσεις και πολίτες: https://digital-strategy.ec.europa.eu/en/policies/data-spaces,

European Commission, “European Data Governance Act”: Το Data Governance Act ενισχύει την εμπιστοσύνη στο διαμοιρασμό δεδομένων, τη διαθεσιμότητα δεδομένων και την άρση τεχνικών εμποδίων στην επαναχρησιμοποίηση: https://digital-strategy.ec.europa.eu/en/policies/data-governance-act,

Allen Institute for AI, “OLMo”: Το OLMo τεκμηριώνει την κατεύθυνση των πλήρως ανοικτών γλωσσικών μοντέλων, με ανοικτή ροή μοντέλου και δεδομένων εκπαίδευσης για ερευνητικό και δημόσια ελέγξιμο οικοσύστημα ΤΝ: https://allenai.org/olmo,

ETH Zurich, EPFL, CSCS, “Apertus: a fully open, transparent, multilingual language model”: Το Apertus αποτελεί ευρωπαϊκό παράδειγμα πλήρως ανοικτού, διαφανούς και πολυγλωσσικού μοντέλου, σχεδιασμένου για κυρίαρχη και ελέγξιμη χρήση ΤΝ: https://ethz.ch/en/news-and-events/eth-news/news/2025/09/press-release-apertus-a-fully-open-transparent-multilingual-language-model.html.