DeepNash, l’IA ha imparato a giocare: così il bot sfida gli umani a “Stratego”

234
(foto da Wikimedia Commons)
Una intelligenza artificiale (AI) di nuova concezione, chiamata DeepNash, ha imparato a giocare a Stratego a livello di giocatore umano esperto; era uno dei pochi giochi da tavolo che le AI non erano ancora riuscite ad apprendere completamente. DeepNash è stata sviluppata dalla DeepMind Technologies Ltd ed i loro risultati sono stati pubblicati su Science. “Questo rappresenta un risultato straordinario che la comunita’ di Stratego non credeva sarebbe stato possibile con le tecnologie attuali”, hanno affermato gli autori dello studio. Per molti anni, il gioco da tavolo Stratego, che mette alla prova la capacità di prendere decisioni relativamente lente, deliberative e logiche in sequenza, ha costituito una delle frontiere della ricerca sulle AI.
Un gioco di informazioni “imperfetto” (in cui alcuni aspetti del gioco sono nascosti agli avversari), Stratego pone sfide chiave ai ricercatori di intelligenza artificiale a causa dei molti aspetti complessi della sua struttura, tra cui avere piu’ stati possibili rispetto a un altro gioco di informazioni imperfetto ben studiato: no-limit Texas Hold’em poker. Fino ad ora non era possibile utilizzare tecniche di ricerca di informazioni imperfette per padroneggiare Stratego. Julien Perolat ed i suoi colleghi hanno introdotto un nuovo metodo che consente ad una intelligenza artificiale di imparare a giocare. Questo nuovo metodo ha portato il bot, chiamato DeepNash, a raggiungere prestazioni di livello esperto nella variante piu’ complessa del gioco: Stratego Classic. Nel cuore di DeepNash c’e’ un algoritmo di apprendimento per rinforzo, “R-NaD”. Per realizzare DeepNash, Perolat e il team hanno combinato R-NaD con un’architettura di rete neurale profonda per apprendere una strategia che gioca a un livello altamente competitivo. DeepNash e’ stato testato contro vari bot Stratego all’avanguardia e giocatori esperti umani. Ha vinto contro tutti i bot e ha raggiunto un livello di gioco altamente competitivo contro giocatori umani esperti di Stratego su Gravon, una piattaforma di gioco su Internet e la piu’ grande piattaforma online per Stratego. In particolare, hanno aggiunto gli autori, questa performance e’ stata raggiunta senza implementare alcun metodo di ricerca, un ingrediente chiave per molti traguardi raggiunti dalle AI nei giochi da tavolo in passato.