8
Ψυχαγωγία

Οδηγός AI κατατροπώνει κάθε αντίπαλο με σωστή οδική συμπεριφορά!

Οδηγός AI κατατροπώνει κάθε αντίπαλο με σωστή οδική συμπεριφορά!
Το σύστημα τεχνητής νοημοσύνης της Sony κατάφερε και κέρδισε όλους τους αντιπάλους, με το να είναι… ευγενικό στο δρόμο!

Έχουμε γράψει πολλές φορές για τις προόδους της τεχνητής νοημοσύνης σε διάφορες εφαρμογές, οι περισσότερες από τις οποίες έχουν τη δυναμική να αλλάξουν εντελώς την ζωή μας. Η τεχνητή νοημοσύνη, όμως, δεν περιορίζεται σε ερευνητικά κέντρα για εφαρμογές ιατρικής. Πρόκειται για ένα πεδίο το οποίο βρίσκει εφαρμογές παντού, ακόμη και στα computer games!

Ο κάθε άνθρωπος που έχει παίξει ένα οποιοδήποτε παιχνίδι στον υπολογιστή ή στην κονσόλα γνωρίζει πως ο καλύτερος αντίπαλος είναι ένας άλλος άνθρωπος. Αυτός είναι και ο λόγος που έγιναν τόσο δημοφιλή τα on-line games: ακριβώς διότι ο αντίπαλος δεν είναι το σύστημα “τεχνητής νοημοσύνης” του παιχνιδιού, αλλά ένας άλλος άνθρωπος! Με απλά λόγια, κανένα σύστημα δε μπορούσε να εξομοιώσει έναν άνθρωπο-παίκτη. Εδώ και δεκαετίες, σε όλα τα παιχνίδια, συνέβαινε ένα από δύο πιθανά ενδεχόμενα: είτε ο άνθρωπος-παίκτης, παίζοντας τακτικά, γινόταν καλύτερος από τους παίκτες που έλεγχε ο υπολογιστής, είτε έχανε διότι ο υπολογιστής… έκλεβε – με τον ένα ή με τον άλλο τρόπο.

Εδώ και κάμποσα χρόνια, όμως, οι εταιρείες παραγωγής παιχνιδιών έχουν γίνει τόσο μεγάλες που υπάρχουν πολλά εκατομμύρια διαθέσιμα για έρευνα και ανάπτυξη. Μια από τις εταιρείες που σίγουρα έχει πολλά διαθέσιμα εκατομμύρια είναι και η Sony, η οποία μάλιστα έχει δημιουργήσει ειδικό τμήμα έρευνας τεχνητής νοημοσύνης, το Sony AI, για να μπορέσει να δημιουργήσει “αντιπάλους” οι οποίοι πραγματικά να είναι καλύτεροι. Ένα από τα παιχνίδια που έβαλαν στο στόχαστρό τους ήταν το Gran Turismo, ένα παιχνίδι αγώνων ταχύτητας, στο οποίο μάλιστα κάλεσαν και μερικούς από τους καλύτερους gamers παγκοσμίως για να αναμετρηθούν με το σύστημά τους. Το σύστημα το ονόμασαν “Sophy” και, όπως είναι αναμενόμενο, στην αρχή δεν ήταν και πολύ γρήγορο.

Εδώ πρέπει να κάνουμε μια μικρή παρένθεση και να επικεντρωθούμε σε κάτι που αναφέραμε πιο πάνω. Στο “ο υπολογιστής έκλεβε”. Είναι προφανές πως ο υπολογιστής λειτουργεί σε πολύ μεγαλύτερη ταχύτητα από τον άνθρωπο. Επίσης μπορεί να “απαντήσει” στις κινήσεις του ανθρώπου σχεδόν ακαριαία. Αυτό από μόνο του είναι ένα είδος “κλεψίματος”. Αλλά, μιας και μιλάμε για παίκτες που ελέγχει το ίδιο το παιχνίδι, μπορεί να εφαρμόσει και διαφορετικούς κανόνες, κάνοντας τη νίκη πολύ πιο δύσκολη για τους ανθρώπους. Κι αυτό είναι “κλέψιμο”. Όπως “κλέψιμο” είναι και το να ελέγχει πράγματα που γίνονται με κάποια τυχαιότητα. Αν φέρουμε το “ποδοσφαιράκι” FIFA, για παράδειγμα, για κάθε πάσα του παίκτη υπάρχει μια τυχαιότητα στο να κάνει λάθος και η μπάλα να καταλήξει στα πόδια αντιπάλου. Αν το σύστημα του παιχνιδιού “πειράζει” αυτή την τυχαιότητα, με αποτέλεσμα οι πάσες του παίκτη-ανθρώπου να έχουν ακρίβεια 30% ενώ οι πάσες του παίκτη-υπολογιστή να γίνονται πάντα στο 100%, είναι κι αυτό “κλέψιμο”. Όπως είναι προφανές, ο καθένας μπορεί να καταλάβει πως χάνει επειδή ο υπολογιστής κλέβει, κάτι πολύ σημαντικό στην εμπειρία του παιχνιδιού.

Επιστρέφοντας στη Sony, το Sophy είναι ένα σύστημα τεχνητής νοημοσύνης το οποίο εστίασε στο Gran Turismo, το οποίο απαιτεί από τον παίκτη να ελέγξει ένα αυτοκίνητο στα όρια, ακολουθώντας όλους τους κανόνες της φυσικής, σε πραγματικό χρόνο. Τα αυτοκίνητα πρέπει να κινούνται σε ιλιγγιώδεις ταχύτητες, σε πολύ κοντινές αποστάσεις μεταξύ τους, περνώντας ξυστά από εμπόδια, ενώ το παραμικρό λάθος ή απόκλιση μπορεί να οδηγήσει στην απώλεια ελέγχου ή σε τρακάρισμα. Ήδη το υποσύστημα φυσικής του Gran Turismo είναι ιδιαίτερα αληθοφανές και μπορεί να εξομοιώσει πράγματα όπως την αεροδυναμική του κάθε αυτοκινήτου ή τον συντελεστή τριβής στα λάστιχα! Το GT Sophy προφανώς δεν “βλέπει” την εικόνα του παιχνιδιού όπως τη βλέπουν οι άνθρωποι, αλλά “διαβάζει” δεδομένα από το παιχνίδι, όπως η θέση του αυτοκινήτου στην πίστα, οι θέσεις των άλλων αυτοκινήτων, οι δυνάμεις που ασκούνται στο αυτοκίνητο, η γεωμετρία της πίστας, και λοιπά. Ως απάντηση, το σύστημα δίνει εντολές για στροφή του τιμονιού, φρενάρισμα ή επιτάχυνση. Η αλληλεπίδραση μεταξύ παιχνιδιού και Sophy γίνεται 10 φορές το δευτερόλεπτο, ρυθμός ο οποίος, όπως έχουν δει οι ερευνητές, ταιριάζει με την ταχύτητα των αντανακλαστικών ενός ανθρώπου παίκτη.

Αφού πέρασαν μήνες εκπαιδεύοντας το σύστημα, οι ερευνητές κατάφεραν και βελτίωσαν τις επιδόσεις. Στην αρχή, η Sophy πάσχιζε απλά να κρατήσει το όχημα εντός πίστας, αλλά σταδιακά βελτιώθηκε και σύντομα έφτασε στο επίπεδο της ενσωματωμένης τεχνητής νοημοσύνης του παιχνιδιού, δηλαδή μπορούσε να ανταγωνιστεί τους “οδηγούς” που ελέγχει το ίδιο το Gran Turismo, με τους οποίους όλοι οι παίκτες του παιχνιδιού μαθαίνουν τον χειρισμό και προπονούνται. Πολύ σύντομα, όμως, η Sophy έκανε χρόνους πολύ κοντά στην κορυφή των ανθρώπων που έπαιζαν το παιχνίδι on-line! Μετά από εννέα μέρες εκπαίδευσης, το GT Sophy σταμάτησε να βελτιώνει τους χρόνους, αλλά ήταν ήδη γρηγορότερο από κάθε άνθρωπο!

Αναλύοντας τον τρόπο οδήγησης, οι ερευνητές αλλά και οι παίκτες με τους οποίους συνεργάζονταν είδαν πως η Sophy οδηγούσε κάπως “περίεργα”. Με άλλα λόγια, μπορούσε και εκμεταλλευόταν σημεία της πίστας και έπαιρνε στροφές με τρόπο που οι άνθρωποι απέφευγαν, γιατί η πιθανότητα λάθους ήταν μεγάλη. Παράλληλα, το Gran Turismo έχει και ανθρώπους κριτές, οι οποίοι δίνουν πόντους ποινής για ό,τι θεωρούν “επικίνδυνη οδήγηση”. Αυτές οι ποινές ήταν και ο λόγος που το GT Sophy έχανε σε πολλούς αγώνες, παρά το ότι “έγραφε” καλύτερους χρόνους!

Οι (κορυφαίοι) παίκτες που είχε στρατολογήσει η Sony γρήγορα έμαθαν πως έπρεπε να αποφεύγουν τα αυτοκίνητα που έλεγχε η Sophy, γιατί απλά “έμπαινε” στις στροφές πολύ επιθετικά, αδιαφορώντας για το αν έβγαζε τους αντιπάλους εκτός πίστας! Οι ερευνητές είχαν δουλειά να κάνουν. Έπρεπε να βρουν τρόπο να ποσοτικοποιήσουν τους κανόνες σωστής συμπεριφοράς, με τρόπο που να κάνουν τη Sophy να οδηγεί χωρίς να προκαλεί ατυχήματα, αλλά και χωρίς να χάσει την ταχύτητά της! Έπρεπε να βρουν τη χρυσή τομή μεταξύ επιθετικότητας και παθητικότητας.

Το εκπληκτικό είναι πως… τα κατάφεραν! Όταν οι ερευνητές της Sony έφεραν τη νέα έκδοση της Sophy σε αγώνα έναντι ανθρώπων οδηγών, η επιθετικότητα είχε εξαφανιστεί. Η Sophy όμως δεν έκανε πίσω σε κάθε κόντρα. Έμαθε να αφήνει αρκετό χώρο, ίσα ίσα για να χωράει και το άλλο αυτοκίνητο, αλλά χωρίς να κάνει πίσω! Και βέβαια, χωρίς να χάσει αυτή την εκπληκτική της ικανότητα να “γράφει” απίστευτους χρόνους!

Το αποτέλεσμα ήταν πως όλοι οι παίκτες που έτρεξαν εναντίον του GT Sophy έμειναν ιδιαίτερα ικανοποιημένοι. Το νέο σύστημα συμπεριφέρεται ακριβώς όπως ένας άνθρωπος, αφήνοντας “τόσο όσο” στον αντίπαλο, έτσι ώστε να μην χάσει χρόνο αλλά και να μη μπορεί να το κατηγορήσει κανένας πως προκάλεσε ατύχημα ή πως έκλεισε το άλλο αυτοκίνητο. Με άλλα λόγια, η Sophy έμαθε να οδηγεί καλύτερα απ’ ότι βλέπουμε ακόμη και στη Formula-1, αλλά εξακολουθώντας να είναι πιο γρήγορη από οποιονδήποτε άνθρωπο παίκτη.

Ανεξάρτητοι ερευνητές που είδαν τη δουλειά της Sony έμειναν εντυπωσιασμένοι από το αποτέλεσμα. Βέβαια, για τη Sony η δουλειά έχει τελειώσει – όχι πως θα σταματήσουν τις έρευνες – και σκοπεύουν να βάλουν το GT Sophy στην επόμενη έκδοση του παιχνιδιού! Για τους ερευνητές τεχνητής νοημοσύνης, όμως, η πρόκληση είναι διαφορετική. Όπως είδαμε, η ισορροπία μεταξύ επιθετικής οδήγησης και “σωστής” συμπεριφοράς ήταν κάτι που βρήκαν οι ερευνητές της Sony μετά από πολλούς πειραματισμούς, αλλάζοντας “με το χέρι” τις ρυθμίσεις, μέχρι να είναι ικανοποιητικό το αποτέλεσμα. Οι ανεξάρτητοι ερευνητές θέλουν να φτάσουν σε ένα σύστημα το οποίο να είναι σε θέση να “καταλάβει” από μόνο του τη σωστή συμπεριφορά και να βρει μόνο του τις παραμέτρους για να προσαρμόσει τη συμπεριφορά του. Με άλλα λόγια, θέλουν ένα σύστημα το οποίο μπορεί να μάθει από μόνο του τους κανόνες!

Σε κάθε περίπτωση, το σύστημα της Sony έχει καταφέρει να φέρει μια μικρή επανάσταση στον χώρο του gaming, καθώς έδειξε στους (ανθρώπους) παίκτες τρόπους για να οδηγούν γρηγορότερα, τους οποίους δεν είχαν σκεφτεί μόνοι τους. Όπως αναφέρει η Emily Jones, μια από τις κορυφαίες gamers στο Gran Turismo, όταν ανεβαίνει ο πήχης, όλοι βελτιώνονται.