虛張聲勢、捨車保帥……人工智能使“計”擊敗人類遊戲玩家

2022-12-09由太史憶秋發佈於科技

來源:科技日報

據英國《新科學家》網站12月1日報道，總部位於英國的“深度思維”公司研發的新人工智能“DeepNash”(深度納什)學會了在“西洋陸軍棋”(Stratego)遊戲中，使用虛張聲勢等欺騙手段來擊敗人類對手。在與專業人類玩家進行的50場排名賽中，“深度納什”得勝率為84%，躋身前三名。相關研究刊發於最新一期《科學》雜誌。

西洋陸軍棋是一款極其複雜的遊戲，有10535種可能的遊戲場景。相比之下，國際象棋和撲克要少得多。“深度思維”公司的朱利安·佩羅拉特表示:“最令人驚訝的是，‘深度納什’學會了在遊戲中使用較弱的棋子虛張聲勢，而且會為了勝利犧牲重要棋子。”

研究團隊指出，“深度納什”通過在55億場遊戲中與自己對決來攻克西洋陸軍棋。它沒有試圖通過搜索所有可能的遊戲場景來進行遊戲，也沒有被訓練與特定選手比賽，而是利用一種算法不斷將其行為導向經濟博弈論所指導的最優策略，該最佳策略能保證其與完美對手的勝率至少為50%。

美國紐約大學副教授朱利安·託格利烏斯表示，在此策略下，儘管對手會隱藏一些信息，該遊戲存在大量可能的遊戲場景，每個回合都可採取許多不同的手段，“深度納什”仍能作出決策取得勝利，“這是一件我們以前無法真正做到的事情”。

“深度納什”已經戰勝了人類和人工智能對手。在通過在線遊戲平台與專業人類玩家進行的50場排名賽中，它的得勝率為84%，躋身前三名。在與西洋陸軍棋頂級遊戲機器人，包括此前贏得該遊戲世界計算機錦標賽的幾款機器人進行的比賽中，它也取得了97%的勝率。

馬耳他大學的喬治斯·揚納卡斯基説:“優秀的玩家往往會記住對手的棋子並預測他們的部署模式。‘深度納什’在這兩方面都做得很好:在記憶力方面它可能更具競爭優勢，而且，它會虛張聲勢、出其不意。”