7
Τεχνολογία

Έτσι θα γράφεις με τη φωνή

Έτσι θα γράφεις με τη φωνή
Το Dictation σου επιτρέπει να υπαγορεύσεις τα μηνύματα ηλεκτρονικού ταχυδρομείου και τα έγγραφά σου χρησιμοποιώντας οποιαδήποτε γλώσσα. Μετατρέπει την ομιλία σε κείμενο με ακρίβεια σε πραγματικό χρόνο και υποστηρίζει emoji, παραγράφους και ακόμη και σημεία στίξης χρησιμοποιώντας φωνητικές εντολές.

Η φωνητική υπαγόρευση είναι κάτι το οποίο θα μπορούσε, κάποια στιγμή, να ελαχιστοποιήσει τη χρήση του πληκτρολογίου. Αποτελεί εδώ και δεκαετίες τον κρυφό πόθο πολλών ανθρώπων οι οποίοι δουλεύουν για ώρες κάθε μέρα, χτυπώντας πλήκτρα σε ένα πληκτρολόγιο. Αυτό, βέβαια, μέχρι πρότινος αποτελούσε σενάριο επιστημονικής φαντασίας. Η ακριβής κατανόηση του προφορικού λόγου και η μετατροπή του σε γραπτό κείμενο απεδείχθη πολύ πιο δύσκολη υπόθεση απ’ ότι φαντάζονταν πολλοί. Αυτά μέχρι πρότινος. Γιατί τώρα υπάρχει το Dictation!

Τι είναι το Dictation; Προφανώς, είναι ένα σύστημα φωνητικής αναγνώρισης, το οποίο κάνει ακριβώς αυτό: εσύ υπαγορεύεις και αυτό γράφει! Ο τρόπος που το επιτυγχάνει δεν είναι κάποιο επτασφράγιστο μυστικό· χρησιμοποιεί τη μηχανή αναγνώρισης προφορικού λόγου της Google και με αυτό τον τρόπο μπορεί να καταλάβει περισσότερες από 100 γλώσσες συμπεριλαμβανομένων και των ελληνικών.

Μάλιστα, το Dictation λειτουργεί μέσα από browser και η μοναδική του απαίτηση είναι αυτός ο browser να είναι ο Chrome. Δυστυχώς για τους χρήστες άλλων browsers και κυρίως του Firefox, μιας και το Dictation φαίνεται να λειτουργεί κανονικά στον Edge της Microsoft. Σε κάθε περίπτωση, αυτό δεν είναι πολύ μεγάλο πρόβλημα.

Το Dictation υποστηρίζει και φωνητικές εντολές, για τη διαχείριση του κειμένου. Λέγοντας, για παράδειγμα, «full stop» ή «dot» μπαίνει τελεία, λέγοντας «new paragraph» αλλάζει παράγραφος, εισαγωγικά μπαίνουν λέγοντας «open double quote» και κλείνουν λέγοντας «close double quote» και ούτω καθ’ εξής. Μέσω φωνητικών εντολών μπορούν να μπουν μέχρι και smileys, όπως το 😉 (λέγοντας «wink face») ή το :-/ (λέγοντας «annoyed face»).

Και επειδή για να καταλάβει το πρόγραμμα αυτά που του λες χρειάζεται και ένα καλό μικρόφωνο, μπες στον ΓΕΡΜΑΝΟ και επίλεξε ένα από τα δεκάδες διαθέσιμα headsets.

Πόσο καλά τα καταφέρνει;

Επί του πρακτέου, τώρα, θα πρέπει να αναφέρουμε πως το Dictation δεν είναι τέλειο. Το γεγονός, όμως, πως μπορεί και αναγνωρίζει μια τυχαία φωνή με τυχαία προφορά, είναι αξιοθαύμαστο και οι προγραμματιστές της Google αξίζουν εύφημο μνεία. Στα αγγλικά, οφείλουμε να παραδεχτούμε, η φωνητική αναγνώριση είναι πολύ καλύτερη. Οι λέξεις εμφανίζονται με μεγαλύτερη ακρίβεια, οι φωνητικές εντολές αναγνωρίζονται καλύτερα, ενώ σπανίως θα δεις κάποιο λάθος. Στα Ελληνικά υπάρχει ένα βασικό πρόβλημα: δεν υποστηρίζονται (ακόμη) φωνητικές εντολές στη γλώσσα μας, επομένως θα πρέπει κανείς να δίνει τις εντολές στα Αγγλικά. Μια ακόμη (περίεργη) έλλειψη είναι αυτή του σβησίματος της τελευταίας λέξης ή της τελευταίας πρότασης. Μάλλον οι δημιουργοί του Dictation είναι τόσο σίγουροι για την ακρίβεια του προγράμματός τους, που παρέλειψαν την πιο βασική εντολή! Ακόμη κι αν το Diction ήταν 100% ακριβές, οι άνθρωποι αλλάζουν γνώμη, ενίοτε!

Τελικά, μπορεί το Dictation να αντικαταστήσει το πληκτρολόγιο; Η απάντηση είναι ακόμη όχι. Δε μπορεί να διαχειριστεί κανονικό ρυθμό υπαγόρευσης· η κάθε λέξη θα πρέπει να προφέρεται αργά και καθαρά, οι προτάσεις θα πρέπει να εκφέρονται σε αργό και σταθερό ρυθμό, ενώ η συνεχής εναλλαγή μεταξύ ελληνικού κειμένου και αγγλικών εντολών θα μπερδέψει αρκετούς – και ειδικά δεδομένου πως δεν μπορείς να σβήσεις την τελευταία λέξη παρά μόνο με τη χρήση του πληκτρολογίου. Το Dictation είναι, όμως, μια πρόγευση του μέλλοντος. Κάναμε υπομονή τόσες δεκαετίες για την αυτόματη υπαγόρευση· λίγα χρόνια ακόμη δεν είναι πολλά.