Σε επίπεδα ανθρώπινων δυνατοτήτων δείχνει πως αρχίζει να φτάνει η τεχνητή νοημοσύνη της εταιρίας «Deep Mind» (θυγατρική της Google) ανακοίνωσε πως το σύστημα «DeepNash» έμαθε να παίζει άψογα το επιτραπέζιο «Stratego».
Άλλο ένα «ανθρώπινο» σκαλοπάτι ανέβηκε η τεχνητή νοημοσύνη, καθώς ερευνητές της βρετανικής εταιρείας Deep Mind, θυγατρικής της Google, ανακοίνωσαν ότι το σύστημά τους DeepNash έμαθε να παίζει -και μάλιστα σε υψηλό επίπεδο- το δημοφιλές παγκοσμίως επιτραπέζιο παιγνίδι «Στρατέγκο» (Stratego). Ήταν ένα από τα ελάχιστα επιτραπέζια παιγνίδια που μέχρι σήμερα δεν είχε «κατακτήσει» η τεχνητή νοημοσύνη.
Οι ερευνητές έκαναν τη σχετική δημοσίευση στο περιοδικό Science
Οι ερευνητές, οι οποίοι έκαναν τη σχετική δημοσίευση στο κορυφαίο επιστημονικό περιοδικό «Science», έκαναν λόγο για «ένα εντυπωσιακό επίτευγμα που η κοινότητα του Stratego δεν πίστευε πως θα ήταν εφικτό με τις υπάρχουσες τεχνικές».
Εδώ και πολλά χρόνια, το Stratego, το οποίο δοκιμάζει την ικανότητα των παικτών στη λήψη σχετικά αργών αλλά πολύ μελετημένων λογικών αποφάσεων, αποτελούσε έναν στόχο-όριο για την έρευνα στο πεδίο της τεχνητής νοημοσύνης. Καθώς αποτελεί ένα παιγνίδι «ατελούς» πληροφόρησης, με όψεις που μένουν κρυφές από τους αντιπάλους, το Stratego με την πολύπλοκη δομή του ενέχει σημαντικές προκλήσεις για τους ερευνητές της τεχνητής νοημοσύνης, σαφώς περισσότερες από ένα άλλο παιγνίδι ατελούς πληροφόρησης, το πόκερ Texas Hold’em, όπου η τεχνητή νοημοσύνη είχε ήδη επιτυχίες.
Το σύστημα τεχνητής νοημοσύνης μαθαίνει να παίζει «Stratego» σε υψηλό επίπεδο
Παρόλα αυτά, οι μηχανικοί και ειδικοί πληροφορικής της Deep Mind εισήγαγαν μια καινοτόμο μέθοδο που επιτρέπει στο σύστημα τεχνητής νοημοσύνης τους να μάθει να παίζει Stratego και μάλιστα σε υψηλό επίπεδο. Όπως έδειξαν οι δοκιμές του στη διαδικτυακή πλατφόρμα gaming Gravon (τη μεγαλύτερη στον κόσμο online για Stratego), το bot DeepNash επιτυγχάνει αποτελέσματα ανάλογα των πολύ καλών ανθρώπων παικτών.
Το DeepNash κέρδισε οποιοδήποτε άλλο bot που παίζει Stratego, καθώς και πολλούς ανθρώπους εξπέρ του παιγνιδιού. Στον πυρήνα του συστήματος βρίσκεται ένας νέος αλγόριθμος ενισχυτικής μάθησης, ο R-NaD, ο οποίος συνδυάζεται με αρχιτεκτονική βαθιού νευρωνικού δικτύου.
Πηγή