13
Επιστήμη & Έρευνα

Τα ρομπότ μαθαίνουν όπως οι άνθρωποι

Τα ρομπότ μαθαίνουν όπως οι άνθρωποι
Μια νέα σελίδα στην ιατρική ρομποτική ανοίγει με το επίτευγμα ερευνητών που δίδαξαν σε ένα ρομπότ-χειρουργό πώς να ράβει δείχνοντάς του βίντεο χειρουργικών επεμβάσεων.

Αυτή τη στιγμή, στο YouTube ανεβαίνουν 500 ώρες βίντεο κάθε λεπτό της ημέρας. Μιλάμε για πρωτοφανείς ποσότητες υλικού, το οποίο καλύπτει οτιδήποτε μπορεί να φανταστεί κανείς. Από βίντεο εκλαϊκευμένης επιστήμης, ερασιτεχνικά ή και επαγγελματικά ντοκιμαντέρ, οδηγούς για χειροτεχνίες, κατασκευές ή επισκευές, σχολιασμούς επί παντός επιστητού, ερασιτεχνικές ταινίες ή σειρές, μέχρι ιατρικά βίντεο. Με το κατάλληλο υλικό, μπορείς να μάθεις να κάνεις πράγματα, από το να χτίσεις έναν τοίχο με τούβλα, μέχρι… να μάθεις να γράφεις κώδικα.

Κάπως έτσι πρέπει να σκέφτηκαν οι ερευνητές του University of California, Berkeley, και να σκέφτηκαν «αφού μπορεί να μάθει ένας άνθρωπος να κάνει, πχ, ράμματα σε ανθρώπους, γιατί να μη μπορούμε να βάλουμε έναν υπολογιστή να δει πολλά βίντεο και να ‘μάθει’ να κάνει το ίδιο»; Και το έκαναν!

Τα ράμματα δεν είναι, προφανώς, διαδικασία ζωτικής σημασίας, αλλά είναι ένα καλό πρώτο βήμα για το σύστημα. Επίσης πρόκειται για μια κουραστική και επαναλαμβανόμενη διαδικασία, την οποία είναι αναγκασμένοι να εκτελούν οι χειρουργοί μετά από κάθε επέμβαση.

Με τη συνεργασία του UC Berkeley με την Intel, οι ερευνητές δημιούργησαν ένα ημιαυτόνομο σύστημα τεχνητής νοημοσύνης deep learning, το οποίο ονόμασαν Motion2Vec. Το σύστημα σχεδιάστηκε ώστε να δει αρκετά βίντεο χειρουργείων, τα οποία υπάρχουν διαθέσιμα στο Internet και απεικονίζουν αληθινούς γιατρούς, να αναλύσει τις κινήσεις τους κατά τη διάρκεια των σταδίων της ραφής, τις κινήσεις της βελόνας, την αλλαγή χεριού, την έξοδο, και έπειτα να τα μιμηθεί με μεγάλη ακρίβεια.

Για να καταλάβεις το σύστημα, μπορείς να δεις το βίντεο:

Προφανώς, οι άνθρωποι μπορούν να δουν ένα οποιοδήποτε βίντεο και να μάθουν να κάνουν κάτι, αλλά οι υπολογιστές δεν λειτουργούν έτσι – τουλάχιστον όχι ακόμα. Τα υπολογιστικά συστήματα βλέπουν μεμονωμένα pixels σε ένα βίντεο και χρειάζεται τεράστια επεξεργαστική ισχύς και συστήματα τεχνητής νοημοσύνης για να αναλύσουν τα βίντεο, να ξεχωρίσουν το περιεχόμενο και να μπορέσουν να εντοπίσουν χρήσιμες πληροφορίες εντός τους. Για αυτό το λόγο οι ερευνητές χρησιμοποίησαν ένα συγκεκριμένο είδος νευρωνικού δικτύου, το οποίο λειτουργεί καλύτερα στην αναγνώριση εικόνας. Έτσι μπόρεσαν να βάλουν το σύστημα να εντοπίσει τα χέρια του γιατρού και να αντιστοιχίσει τις κινήσεις τους με αυτές των μηχανικών βραχιόνων του συστήματος. Ο απώτερος στόχος είναι, προφανώς, να βάλουν το σύστημα να εκτελεί τις ίδιες κινήσεις με αυτές των γιατρών.

Το ενδιαφέρον είναι πως το σύστημα χρειάστηκε να δει μόλις 78 βίντεο για να φτάσει σε ακρίβεια 85,5%, ενώ το σφάλμα στην χωρική στόχευση ήταν κατά μέσο όρο 0,94 εκατοστά.

Βέβαια το σύστημα είναι ακόμη στα σπάργανα και είμαστε πολλά χρόνια μακριά από το να βάλουμε ρομπότ να εκτελούν έστω και απλές δουλειές μέσα σε χειρουργεία. Κάποια στιγμή, όμως, θα γίνει και αυτό και θα μπορούμε να έχουμε μηχανήματα τα οποία θα μπορούν να αναλαμβάνουν τις κουραστικές και επαναλαμβανόμενες δουλειές, επιτρέποντας στους γιατρούς να επικεντρωθούν σε πιο σοβαρά πράγματα – ή ακόμη και να προχωρήσουν στον επόμενο ασθενή, αφήνοντας το ρομπότ και μερικούς βοηθούς ή νοσοκόμους να τελειώσουν την επέμβαση.