楠木軒

虛張聲勢、捨車保帥……人工智能使“計”擊敗人類遊戲玩家

由 太史憶秋 發佈於 科技

來源:科技日報

據英國《新科學家》網站12月1日報道,總部位於英國的“深度思維”公司研發的新人工智能“DeepNash”(深度納什)學會了在“西洋陸軍棋”(Stratego)遊戲中,使用虛張聲勢等欺騙手段來擊敗人類對手。在與專業人類玩家進行的50場排名賽中,“深度納什”得勝率為84%,躋身前三名。相關研究刊發於最新一期《科學》雜誌。

西洋陸軍棋是一款極其複雜的遊戲,有10535種可能的遊戲場景。相比之下,國際象棋和撲克要少得多。“深度思維”公司的朱利安·佩羅拉特表示:“最令人驚訝的是,‘深度納什’學會了在遊戲中使用較弱的棋子虛張聲勢,而且會為了勝利犧牲重要棋子。”

研究團隊指出,“深度納什”通過在55億場遊戲中與自己對決來攻克西洋陸軍棋。它沒有試圖通過搜索所有可能的遊戲場景來進行遊戲,也沒有被訓練與特定選手比賽,而是利用一種算法不斷將其行為導向經濟博弈論所指導的最優策略,該最佳策略能保證其與完美對手的勝率至少為50%。

美國紐約大學副教授朱利安·託格利烏斯表示,在此策略下,儘管對手會隱藏一些信息,該遊戲存在大量可能的遊戲場景,每個回合都可採取許多不同的手段,“深度納什”仍能作出決策取得勝利,“這是一件我們以前無法真正做到的事情”。

“深度納什”已經戰勝了人類和人工智能對手。在通過在線遊戲平台與專業人類玩家進行的50場排名賽中,它的得勝率為84%,躋身前三名。在與西洋陸軍棋頂級遊戲機器人,包括此前贏得該遊戲世界計算機錦標賽的幾款機器人進行的比賽中,它也取得了97%的勝率。

馬耳他大學的喬治斯·揚納卡斯基説:“優秀的玩家往往會記住對手的棋子並預測他們的部署模式。‘深度納什’在這兩方面都做得很好:在記憶力方面它可能更具競爭優勢,而且,它會虛張聲勢、出其不意。”