13
Επιστήμη & Έρευνα

Τεχνητή νοημοσύνη μεταφράζει επιγραφές στα αρχαία ελληνικά

Τεχνητή νοημοσύνη μεταφράζει επιγραφές στα αρχαία ελληνικά
Η Google DeepMind συνεργάζεται με κλασικούς μελετητές για να δημιουργήσει ένα νέο εργαλείο τεχνητής νοημοσύνης που χρησιμοποιεί νευρωνικά δίκτυα για να βοηθήσει τους ιστορικούς να αποκρυπτογραφήσουν το κείμενο κατεστραμμένων επιγραφών από την αρχαία Ελλάδα.

Η αποκατάσταση των αρχαίων κειμένων, είτε αυτά βρίσκονται γραμμένα σε περγαμηνές, πάπυρους, είτε πάνω σε μάρμαρο, μέταλλο ή αγγεία, αποτελεί τεράστια πρόκληση, μιας και πολλά από αυτά βρίσκονται σε τόσο κακή κατάσταση ώστε μεγάλα τμήματά τους δεν διαβάζονται ή λείπουν εντελώς. Επίσης δύσκολη είναι και η τοποθέτησή τους, τόσο χρονικά όσο και χωρικά, μιας και τα αρχαία έχουν μετακινηθεί πολλές φορές μέσα στους αιώνες, ενώ η ραδιοχρονολόγηση δεν λειτουργεί για μάρμαρο ή μέταλλο, ενώ σε περγαμηνές και παπύρους δεν χρησιμοποιείται γιατί απαιτεί την καταστροφή τμήματος των αντικειμένων. Επομένως, η διαδικασία πέφτει στους ώμους των ειδικών αρχαιολόγων, οι οποίοι πρέπει να αξιοποιήσουν όλα τα στοιχεία που διαθέτουν και όλες τους τις γνώσεις για να κάνουν μια εκτίμηση του κειμένου που λείπει αλλά και των άλλων στοιχείων, όπως της χρονολόγησης μέσω άλλων γνωστών κειμένων – και, προφανώς, της ιστορίας.

Τώρα όμως, έρχεται η Google με το DeepMind και, σε συνεργασία με ιστορικούς, δημιούργησε ένα νέο εργαλείο τεχνητής νοημοσύνης, το οποίο ονομάζουν Ithaca, και το οποίο χρησιμοποιεί βαθιά νευρωνικά δίκτυα για να αποκρυπτογραφήσει τέτοιες επιγραφές από την αρχαία Ελλάδα!

Το νέο σύστημα βασίζεται σε ένα προηγούμενο ονόματι Pythia (Πυθία), και δεν περιορίζεται στην συμπλήρωση του ελλιπούς κειμένου αλλά μπορεί και να χρονολογήσει το κάθε εύρημα με μεγάλη ακρίβεια, αλλά και να το τοποθετήσει στον Ελλαδικό χάρτη! Μάλιστα, το σύστημα ήδη βοήθησε στο να λυθεί μια διχογνωμία σχετικά με την ακριβή ημερομηνία ενός συνόλου βουλευμάτων της αρχαίας Αθήνας, το οποίο απασχολούσε για χρόνια τους ερευνητές.

Οι δημιουργοί του συστήματος έγραφαν το 2019: «Ένα από τα προβλήματα του να βγάλεις νόημα από ελλιπή τμήματα κειμένου είναι το ότι υπάρχουν πολλές πιθανές λύσεις. Σε πολλά παιχνίδια λέξεων ή παζλ, οι παίκτες προσπαθούν να μαντέψουν γράμματα για να συμπληρώσουν μια λέξη ή μια φράση – όσο περισσότερα γράμματα βρίσκουν, τόσο περιορίζεται το εύρος των πιθανών λύσεων. Αντίθετα με αυτά τα παιχνίδια, όμως, στα οποία οι παίκτες πρέπει να μαντέψουν μια απομονωμένη φράση, οι ιστορικοί που αποκαθιστούν ένα κείμενο μπορούν να εκτιμήσουν την πιθανότητα των διαφορετικών πιθανών λύσεων βάσει άλλων στοιχείων που βρίσκονται στο ίδιο το κείμενο, όπως γραμματικές και γλωσσικές λεπτομέρειες, σχήμα και σύνθεση, παραλληλισμοί εντός του κειμένου, αλλά και ιστορική συνάφεια».

Για να επιταχύνουν τη διαδικασία, οι ερευνητές της ομάδας DeepMind, με επικεφαλής τον Έλληνα Γιάννη Ασσαέλ, συνεργάστηκαν με ειδικούς ερευνητές του πανεπιστημίου της Οξφόρδης για να αναπτύξουν, αρχικά το σύστημα Pythia, το οποίο μπορούσε να αποκαταστήσει αρχαία κείμενα. Το πρώτο βήμα ήταν να αξιοποιήσουν την βάση δεδομένων του Packard Humanities Institute, το οποίο είναι η μεγαλύτερη ψηφιακή συλλογή αρχαίων Ελληνικών επιγραφών, σε χρήσιμο για υπολογιστές κείμενο. Αυτό περιλάμβανε περίπου 35.000 επιγραφές και πάνω από 3 εκατομμύρια λέξεις, από το, 7ο αιώνα π.Χ. έως και τον 5ο αιώνα μ.Χ. Έπειτα, οι ερευνητές εκπαίδευσαν το σύστημα, τόσο με λέξεις όσο και με μεμονωμένους χαρακτήρες ως είσοδο, ώστε να μπορεί να προβλέψει τα γράμματα ή τις λέξεις που έλειπαν, χρησιμοποιώντας τις δυνατότητες αναγνώρισης συσχετισμών των βαθέων νευρωνικών δικτύων. Όποτε η Pythia ερχόταν αντιμέτωπη με μια ελλιπή επιγραφή, παρήγαγε μέχρι και 20 διαφορετικά πιθανά γράμματα ή λέξεις τα οποία ταίριαζαν με τα κενά, καθώς και το ποσοστό της αξιοπιστίας κάθε πιθανής πρόβλεψης. Έπειτα αναλάμβαναν οι ιστορικοί να αξιολογήσουν τις προτάσεις και να αποφασίσουν, βασιζόμενοι στη δική τους εμπειρία. Μάλιστα, η ομάδα αξιολόγησε το σύστημα, συγκρίνοντάς το με τις προτάσεις μεταπτυχιακών φοιτητών της Οξφόρδης, με ειδίκευση στην επιγραφολογία. Η Pythia είχε ποσοστό λαθών 30,1% έναντι 57,3% για τους φοιτητές, ενώ ολοκλήρωνε τις δοκιμασίες πολύ πιο γρήγορα απ’ ότι οι φοιτητές, σε λίγα δευτερόλεπτα έναντι δύο ωρών, για τη συμπλήρωση 50 επιγραφών.

Τώρα η ομάδα του Ασσαέλ επανέρχεται με το Ithaca, το οποίο μπορεί, εκτός του να συμπληρώνει κείμενο, να κάνει και προβλέψεις για τη γεωγραφική προέλευση των επιγραφών. Μάλιστα, η πιθανοτική κατανομή εμφανίζεται πάνω σε χάρτη, επιτρέποντας στους ερευνητές να δουν με άλλο μάτι τις πιθανές γεωγραφικές συνδέσεις του αρχαίου κόσμου. Η Ithaca μπορεί να παράξει ημερομηνίες ανάμεσα στο 800 π.Χ. και το 800 μ.Χ.

Τα ποσοστά της Ithaca είναι εντυπωσιακά: σε δοκιμές, το σύστημα κατάφερε και πέτυχε ακρίβεια αποκατάστασης της τάξης του 62% έναντι 25% των (ανθρώπων) ιστορικών, ενώ ο συνδυασμός των δύο ανέβασε το ποσοστό στο 72%, κάτι που ο Ασσαέλ και η ομάδα του βλέπουν σαν μια μεγάλη επιτυχία στη συνεργασία ανθρώπου και μηχανής. Επίσης, στον γεωγραφικό εντοπισμό, η Ithaca είχε 71% επιτυχία και χρονικά μπόρεσε να χρονολογήσει τις διάφορες επιγραφές με ακρίβεια 30 ετών!

Η χρησιμότητα της Ithaca αποδείχθηκε όταν δοκιμάστηκε σε ένα σετ Αθηναϊκών βουλευμάτων, των οποίων η χρονολόγηση αποτελούσε θέμα μεγάλων διαφωνιών ανάμεσα στους ιστορικούς. Αρχικά, τα βουλεύματα είχαν τοποθετηθεί το νωρίτερο το 446 π.Χ., εκτίμηση βασισμένη σε κάποιες μορφές του γράμματος σίγμα, το οποίο στην Αττική γραφή σχηματιζόταν με τρεις γραμμές (Ϟ), ενώ οι ιστορικοί υπέθεταν πως μετά το 446 π.Χ. οι Αθηναίοι χρησιμοποιούσαν το Ιωνικό Σ στα βουλεύματά τους. Αυτή η λεπτομέρεια αποτελούσε και το κριτήριο για τη χρονολόγηση βουλευμάτων και άλλων Αθηναϊκών επιγραφών, μέχρι που κάποιοι ιστορικοί άρχισαν να αμφισβητούν αυτή την υπόθεση, ειδικά καθώς υπήρχαν αρκετές επιγραφές με βουλεύματα οι οποίες χρονολογήθηκαν με αυτό τον τρόπο έρχονταν σε αντίθεση με τις ιστορικές καταγραφές του Θουκυδίδη. Αυτοί οι ιστορικοί βρήκαν στοιχεία που έδειχναν πως η Αττική «τρίγραμμη» μορφή του σίγμα συνέχισε να χρησιμοποιείται πολύ μετά το 446 π.Χ. και συμπέραναν πως πολλά από αυτά τα βουλεύματα θα μπορούσαν να είναι πολύ νωρίτερα, περί το 420 π.Χ. Η Ithaca προέβλεψε μια ημερομηνία περί το 421 π.Χ., σε συμφωνία αυτού του συμπεράσματος.

Όπως αναφέρει η ιστορικός Thea Sommerschield, μέλος της ομάδας του DeepMind, «μπορεί να φαίνεται μικρή διαφορά, αλλά αυτή η χρονική μετατόπιση έχει σημαντικές επιπτώσεις στην κατανόηση της πολιτικής ιστορίας της Κλασσικής Αθήνας».

Τώρα, το επόμενο βήμα είναι να εκπαιδεύσουν διαφορετικές εκδόσεις της Ithaca ώστε να «δουλεύει» πάνω σε άλλες γλώσσες, όπως τα Ακκαδικά, η Αιγυπτιακή Δημοτική, τα Εβραϊκά και η γλώσσα των Μάγιας.

Το σύστημα έχει τραβήξει το ενδιαφέρον πολλών άλλων αρχαιολόγων και ερευνητών, οι οποίοι βλέπουν σε αυτό μια τεχνολογία η οποία θα μπορούσε να μετασχηματίσει τον χώρο της ιστορίας, δίνοντας σε επιγραφές και άλλα γραπτά ευρήματα την ικανότητα να αλλάξουν (ή να επιβεβαιώσουν) πολλές ιστορικές στιγμές στην παγκόσμια ιστορία. Παράλληλα, η χρήση της τεχνολογίας σε άλλες γλώσσες, όπως στα αιγυπτιακά όπου υπάρχει πιο ακριβής χρονολόγηση (λόγω υλικού) αλλά πολύ περισσότερα ευρήματα τα οποία είναι αγνώστου προελεύσεως, τα οποία θα μπορούσαν, με τις ικανότητες της Ithaca, να τοποθετηθούν τόσο χρονικά όσο και γεωγραφικά.