16
Τάσεις και Ενδιαφέροντα

Πρόβλημα στην όραση; Η Τεχνητή Νοημοσύνη είναι εδώ

Πρόβλημα στην όραση; Η Τεχνητή Νοημοσύνη είναι εδώ
Όχι για να σου διορθώσει την όραση όμως (θα γίνει κι αυτό κάποια στιγμή), αλλά για να σου περιγράψει αυτόματα τις φωτογραφίες που δεν μπορείς να δεις.

Το Web είναι, σε μεγάλο βαθμό, ένα οπτικό μέσο το οποίο έχει χτιστεί πάνω στο γραπτό κείμενο και τις εικόνες. Όσο κι αν προσπαθήσουμε να διαχωρίσουμε τα δύο, η πραγματικότητα είναι πως τις περισσότερες φορές, αυτό είναι πολύ δύσκολο. Και όμως, πολλοί συνάνθρωποί μας με προβλήματα όρασης αναγκάζονται να χρησιμοποιούν μόνο τη μία πλευρά του, αυτήν του κειμένου, μέσω εφαρμογών οι οποίες αναγιγνώσκουν το κείμενο – αλλά οι εικόνες παραμένουν πέρα από τις δυνατότητες, εκτός κι αν οι δημιουργοί των ιστοσελίδων έχουν φροντίσει να περιλάβουν περιγραφή της κάθε εικόνας σε μορφή κειμένου.

Το Facebook δουλεύει εδώ και χρόνια πάνω σε τεχνολογίες αναγνώρισης, οι οποίες προσπαθούν να αναγνωρίσουν τα περιεχόμενα κάθε εικόνας που ανεβαίνει στο γνωστό μέσο κοινωνικής δικτύωσης, έτσι ώστε να είναι δυνατή η περιγραφή τους για τυφλούς και ανθρώπους με προβλήματα όρασης. Το σύστημα στο οποίο κατέληξαν ονομάζεται AAT (Automatic Alternative Text).

Η τελευταία έκδοση του AAT ενσωματώνει πολλά τεχνολογικά άλματα, τα οποία επιτρέπουν την αναγνώριση των εικόνων. Οι ερευνητές έχουν δεκαπλασιάσει τον αριθμό των εννοιών τις οποίες μπορεί να αναγνωρίσει το σύστημα με ακρίβεια! Οι περιγραφές είναι πιο λεπτομερείς, ενώ υπάρχει η δυνατότητα αναγνώρισης δραστηριοτήτων, μνημείων και αναγνωρίσιμων σημείων, διαφόρων ζώων, μεταξύ άλλων. Για παράδειγμα, είναι δυνατόν να παραχθεί μια περιγραφή όπως η ακόλουθη: «Ίσως μια selfie δύο ανθρώπων, εξωτερικός χώρος, ο Πύργος της Πίζα». Σημειώνουμε πως το ίσως προστίθεται σε όλες τις περιγραφές για να καταδείξει πως η περιγραφή δεν είναι γραμμένη από ανθρώπινο χέρι.

Επίσης, στις περιγραφές είναι δυνατή η ανάλυση των ατόμων που βρίσκονται στην φωτογραφία· για παράδειγμα, αντί για «ίσως φωτογραφία 5 ατόμων» πλέον είναι δυνατός ο προσδιορισμός της θέσης τους στην εικόνα, πως υπάρχουν, πχ, δύο άτομα στο κέντρο της φωτογραφίας και άλλοι τρεις στα άκρα, υπονοώντας πως οι δύο στο κέντρο είναι οι σημαντικοί. Ομοίως και για τοπία, αντί για περιγραφή τύπου «ίσως ένα σπίτι και ένα βουνό», είναι δυνατή η ανάλυση καθώς και το ότι το βουνό είναι σημαντικό στη φωτογραφία.

Όλες οι βελτιώσεις αυτές βοηθούν τους ανθρώπους με μειωμένη όραση να καταλάβουν τι περιέχεται σε φωτογραφίες οι οποίες ανεβαίνουν από τους φίλους και τους συγγενείς τους, αλλά και στις δικές τους φωτογραφίες, παρέχοντας περισσότερη πληροφορία και πιο λεπτομερή πληροφορία.

Το Facebook αυτή τη στιγμή έχει δισεκατομμύρια χρήστες, οι οποίοι μοιράζονται ανά πάσα στιγμή δεκάδες εκατομμύρια φωτογραφίες – χάρη στις κάμερες που πλέον βρίσκονται σε κάθε κινητό και κάθε συσκευή. Με τα smartphones και τις γρήγορες ασύρματες επικοινωνίες, είναι δυνατή η ύπαρξη προϊόντων όπως το Facebook και το Instagram, τα οποία έχουν αλλάξει τον τρόπο που επικοινωνούμε. Οι φωτογραφίες αποτελούν τον πιο εύκολο και δημοφιλή τρόπο να γίνει αυτή η επικοινωνία και να μεταφερθεί πληροφορία. Δυστυχώς, όμως, ελάχιστοι είναι αυτοί που κάθονται να γράψουν περιγραφή των φωτογραφιών που ανεβάζουν, κάτι που αποκλείει όσους έχουν προβλήματα όρασης από τις πλατφόρμες. Το Facebook το κατάλαβε αυτό από πολύ νωρίς και αυτός είναι ο λόγος που επένδυσε στην αυτόματη αναγνώριση και την παραγωγή περιγραφών μέσω συστημάτων τεχνητής νοημοσύνης. Η αρχή είναι οι φωτογραφίες του Facebook. Το μέλλον θα μας δείξει τι άλλες δυνατότητες μπορεί να ξεκλειδώσει αυτή η ριζοσπαστική τεχνολογία!