Το Spotify μπαίνει στην εποχή της τεχνητής νοημοσύνης, μέσα από τα podcasts. Συγκεκριμένα, η εταιρεία ανακοίνωσε την έναρξη της υπηρεσίας Voice Translation, η οποία μπορεί να μεταφράσει αυτόματα ένα οποιοδήποτε podcast από την αρχική γλώσσα σε μια άλλη. Το ενδιαφέρον είναι πως η φωνή του ομιλητή δεν αλλάζει, καθώς το εργαλείο μετάφρασης που χρησιμοποιεί το Spotify χρησιμοποιεί τεχνολογία παραγωγής φωνής, η οποία μπορεί να “κλωνοποιήσει” τα χαρακτηριστικά της φωνής του ομιλητή, κάνοντας τη μετάφραση να ακούγεται εντελώς φυσική.
Η λειτουργία αυτή τη στιγμή βρίσκεται σε πιλοτικό στάδιο και είναι ενεργή για συγκεκριμένα podcasts από τους Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons, και Steven Bartlett, και οι μεταφράσεις γίνονται σε Ισπανικά, Γαλλικά, και Γερμανικά. Στο άμεσο μέλλον, το Spotify θέλει να επεκτείνει τη λειτουργία της μετάφρασης και σε άλλους παραγωγούς αλλά και σε επεισόδια σειρών.
Η αυτόματη μετάφραση έχει τεράστια δυναμική αλλά κρύβει και αρκετούς κινδύνους. Η δυναμική έγκειται στο ότι οι podcasters έχουν την ευκαιρία να πιάσουν πολύ μεγαλύτερο κοινό σε νέες χώρες, και το ενδιαφέρον του Spotify (και αρκετών παραγωγών) εστιάζει σε χώρες με τεράστιο κοινό, όπως η Κίνα ή η Ινδία. Προφανώς, το όφελος είναι και οικονομικό, ενώ το ίδιο το εργαλείο αποτελεί μια τεράστια επένδυση του Spotify, όπως και τα συμβόλαια αποκλειστικότητας με διάσημους podcasters, και σίγουρα θα ήθελε να δει αυτές τις επενδύσεις να φέρνουν κέρδη.
Οι κίνδυνοι που ελλοχεύουν σε αυτή την τεχνολογία είναι υπαρκτοί και σημαντικοί, όμως. Ήδη τέτοιες τεχνολογίες χρησιμοποιούνται σε “κομπίνες” με φωνές διάσημων ηθοποιών, ενώ μεγάλος είναι και ο κίνδυνος που προέρχεται από την ίδια τη φύση των συστημάτων τεχνητής νοημοσύνης, και πιο συγκεκριμένα αυτό που είναι γνωστό ως “hallucinations”. Οι μηχανές έχουν την τάση να έχουν “παραισθήσεις” και να εφευρίσκουν δεδομένα εκεί που δεν υπάρχουν. Κάτι τέτοιο σε μια μετάφραση θα μπορούσε να δημιουργήσει προβλήματα, καθώς θα έβαζε τη φωνή κάποιου παραγωγού να λέει πράγματα τα οποία ο ίδιος ποτέ δεν είπε. Το ίδιο ισχύει και για μεταφράσεις λέξεων και φράσεων για τις οποίες δεν υπάρχει ευθεία μετάφραση από τη μία γλώσσα στην άλλη. Παρόμοια είναι και η κατάσταση με τη χροιά, το ύφος, αλλά και το συναίσθημα: ένας ομιλητής μπορεί να χρησιμοποιεί τη γλώσσα με συγκεκριμένο τρόπο για να υποδηλώσει αστεϊσμό, κάτι που θα καταλάβουν όσοι μιλούν την ίδια γλώσσα· δεν είναι βέβαιο, όμως, πως το σύστημα θα καταλάβει τέτοιες λεπτομέρειες και θα μπορέσει να αποδώσει και στην άλλη γλώσσα το αντίστοιχο ύφος. Με άλλα λόγια, κάτι που ο παραγωγός θα πει, για παράδειγμα, με ειρωνεία, μπορεί να μεταφερθεί στην δεύτερη γλώσσα με κυριολεκτικό τρόπο, βάζοντας τόσο τον παραγωγό όσο και το ίδιο το Spotify σε μπελάδες, πιθανώς και νομικής φύσεως.
Αυτά είναι, όμως, προβλήματα που ανακύπτουν επειδή τα συστήματα τεχνητής νοημοσύνης ακόμη βρίσκονται σε νηπιακό στάδιο. Όσο προοδεύουν οι αντίστοιχες τεχνολογίες και βελτιώνονται τα συστήματα μετάφρασης και παραγωγής φωνής, τόσο θα μειώνονται και αυτά τα προβλήματα. Τελικά, είναι αναπόφευκτο πως στο (πιθανότατα εγγύς) μέλλον η αυτόματη μετάφραση φωνής – και εικόνας – θα είναι κάτι τόσο συνηθισμένο όσο το να ανοίγεις το Spotify ή το YouTube και να βλέπεις ένα οποιοδήποτε βίντεο. Το Spotify απλά κάνει την αρχή, και θα πρέπει να είναι προετοιμασμένο να αντιμετωπίσει και τις παιδικές ασθένειες.