Διαβάστε στo motorone.gr: Μια Τεχνητή Νοημοσύνη κερδίζει τους καλύτερους παίκτες στο Gran Turismo
Η Τεχνητή Νοημοσύνη με όνομα GT Sophy έχει στο ενεργητικό της νίκες απέναντι σε τέσσερις από τους καλύτερους ανθρώπους-οδηγούς στον κόσμο σε τρεις διαφορετικές διαδρομές στο Gran Turismo Sport.
Το λογισμικό αναπτύχθηκε από τα εργαστήρια Sony AI στην Νέα Υόρκη υπό τον Peter Wurman και ήταν σε θέση να εκτελέσει κινήσεις ακριβείας εκμεταλλευόμενο ακόμα και το ρεύμα αέρα του προπορευόμενου οχήματος αλλά και να εμποδίζει αντιπάλους να το προσπεράσουν.
H ομάδα ανάπτυξης υλοποίησε ένα είδος μηχανικής μάθησης που χρησιμοποιεί ανταμοιβές και κυρώσεις για να διδάξει το νευρωνικό δίκτυο της Τεχνητής Νοημοσύνης για το πώς θα κερδίσει. Κατά τη διάρκεια της προπόνησης, η GT Sophy, η οποία λειτουργούσε σε ξεχωριστό υπολογιστή, έπαιξε το παιχνίδι σε έως και 20 κονσόλες PlayStation 4 ταυτόχρονα!
Η ομάδα έδωσε στην ΤΝ τη δυνατότητα να επιταχύνει, να φρενάρει και να στρίψει μαζί με πληροφορίες σε πραγματικό χρόνο σχετικά με τη θέση των αυτοκινήτων στο παιχνίδι, συμπεριλαμβανομένης της δικής της, και έναν χάρτη των επόμενων 6 δευτερολέπτων της πίστας, πράγμα που σήμαινε ότι είχε καλύτερη εικόνα για την πίστα εφόσον ήταν προπορευόμενη. Οι ερευνητές σημειώνουν ότι αυτές οι πληροφορίες δεν ήταν διαθέσιμες στους ανθρώπινους παίκτες, δίνοντας στην Τεχνητή Νοημοσύνη ένα μικρό πλεονέκτημα, με τους ανθρώπινους οδηγούς να έχουν άλλες σημαντικές δυνατότητες, όπως για παράδειγμα η χειροκίνητη αλλαγή ταχυτήτων, κάτι που δεν μπορεί να κάνει προς το παρόν η GT Sophy.
Η ομάδα ανάπτυξης έδινε ανταμοιβές στην GT Sophy όταν παρέμεινε στην πίστα και οδηγούσε γρηγορότερα και επέβαλε κυρώσεις όταν έβγαινε εκτός διαδρομής ή δεν πήγαινε γρήγορα ή ακόμα και όταν επέλεγε πιο ασφαλή οδήγηση για να μην συγκρουστεί. Μέσα σε λίγες ημέρες, η GT Sophy έμαθε να ολοκληρώνει τα κομμάτια της διαδρομής ταχύτερα από το 95% των ανθρώπινων παικτών σε online πίνακες κατάταξης. Μετά από εννέα ακόμη ημέρες εκπαίδευσης η GT Sophy μείωσε αρκετά δέκατα του δευτερολέπτου τους χρόνους του γύρου της, σε συνολικά 45.000 ώρες οδήγησης, και κατάφερε να τερματίσει γρηγορότερα από οποιονδήποτε άνθρωπο-παίκτη στους πίνακες κατάταξης.
Στη συνέχεια, οι ερευνητές προσκάλεσαν τέσσερις από τους καλύτερους παίκτες Gran Turismo στον κόσμο να ανταγωνιστούν τέσσερα αυτοκίνητα που έλεγχε η GT Sophy σε έναν ομαδικό αγώνα, οπότε οκτώ αυτοκίνητα ήταν στην πίστα συνολικά. Η Τεχνητή Νοημοσύνη κέρδισε με μεγάλη διαφορά τους ανθρώπους.
Η παραπάνω τεχνολογία δεν αναμένεται να βρει κάποια υλοποίηση στα συστήματα αυτόνομης οδήγησης των αυτοκινήτων αλλά προφανώς προορίζεται για ακόμα πιο ανταγωνιστικούς μη-ανθρώπινους παίκτες και αντιπάλους στα παιχνίδια οδήγησης.
Με πληροφορίες από το NewsScientist
Το λογισμικό αναπτύχθηκε από τα εργαστήρια Sony AI στην Νέα Υόρκη υπό τον Peter Wurman και ήταν σε θέση να εκτελέσει κινήσεις ακριβείας εκμεταλλευόμενο ακόμα και το ρεύμα αέρα του προπορευόμενου οχήματος αλλά και να εμποδίζει αντιπάλους να το προσπεράσουν.
H ομάδα ανάπτυξης υλοποίησε ένα είδος μηχανικής μάθησης που χρησιμοποιεί ανταμοιβές και κυρώσεις για να διδάξει το νευρωνικό δίκτυο της Τεχνητής Νοημοσύνης για το πώς θα κερδίσει. Κατά τη διάρκεια της προπόνησης, η GT Sophy, η οποία λειτουργούσε σε ξεχωριστό υπολογιστή, έπαιξε το παιχνίδι σε έως και 20 κονσόλες PlayStation 4 ταυτόχρονα!
Η ομάδα έδωσε στην ΤΝ τη δυνατότητα να επιταχύνει, να φρενάρει και να στρίψει μαζί με πληροφορίες σε πραγματικό χρόνο σχετικά με τη θέση των αυτοκινήτων στο παιχνίδι, συμπεριλαμβανομένης της δικής της, και έναν χάρτη των επόμενων 6 δευτερολέπτων της πίστας, πράγμα που σήμαινε ότι είχε καλύτερη εικόνα για την πίστα εφόσον ήταν προπορευόμενη. Οι ερευνητές σημειώνουν ότι αυτές οι πληροφορίες δεν ήταν διαθέσιμες στους ανθρώπινους παίκτες, δίνοντας στην Τεχνητή Νοημοσύνη ένα μικρό πλεονέκτημα, με τους ανθρώπινους οδηγούς να έχουν άλλες σημαντικές δυνατότητες, όπως για παράδειγμα η χειροκίνητη αλλαγή ταχυτήτων, κάτι που δεν μπορεί να κάνει προς το παρόν η GT Sophy.
Η ομάδα ανάπτυξης έδινε ανταμοιβές στην GT Sophy όταν παρέμεινε στην πίστα και οδηγούσε γρηγορότερα και επέβαλε κυρώσεις όταν έβγαινε εκτός διαδρομής ή δεν πήγαινε γρήγορα ή ακόμα και όταν επέλεγε πιο ασφαλή οδήγηση για να μην συγκρουστεί. Μέσα σε λίγες ημέρες, η GT Sophy έμαθε να ολοκληρώνει τα κομμάτια της διαδρομής ταχύτερα από το 95% των ανθρώπινων παικτών σε online πίνακες κατάταξης. Μετά από εννέα ακόμη ημέρες εκπαίδευσης η GT Sophy μείωσε αρκετά δέκατα του δευτερολέπτου τους χρόνους του γύρου της, σε συνολικά 45.000 ώρες οδήγησης, και κατάφερε να τερματίσει γρηγορότερα από οποιονδήποτε άνθρωπο-παίκτη στους πίνακες κατάταξης.
Στη συνέχεια, οι ερευνητές προσκάλεσαν τέσσερις από τους καλύτερους παίκτες Gran Turismo στον κόσμο να ανταγωνιστούν τέσσερα αυτοκίνητα που έλεγχε η GT Sophy σε έναν ομαδικό αγώνα, οπότε οκτώ αυτοκίνητα ήταν στην πίστα συνολικά. Η Τεχνητή Νοημοσύνη κέρδισε με μεγάλη διαφορά τους ανθρώπους.
Η παραπάνω τεχνολογία δεν αναμένεται να βρει κάποια υλοποίηση στα συστήματα αυτόνομης οδήγησης των αυτοκινήτων αλλά προφανώς προορίζεται για ακόμα πιο ανταγωνιστικούς μη-ανθρώπινους παίκτες και αντιπάλους στα παιχνίδια οδήγησης.
Με πληροφορίες από το NewsScientist