機器之心報道
編輯:魔王
在遊戲裏訓練「神經網絡小怪獸」,學習強化學習!
想了解神經網絡,但不知道如何入手?教程太枯燥,論文不好懂?
別怕,這裏有款多人在線戰術競技遊戲(MOBA),讓你在西部牛仔的世界中訓練自己的神經網絡。在這裏,所有「智能體」都是類似怪獸的生物,還有武器!
故事的背景是:Derk 博士想要創建一個具備「神經網絡」大腦的生物。
這款名為「Dr. Derk's Mutant Battlegrounds」的遊戲是一個基於 AI 的實驗性遊戲。玩家的任務是武裝自己的小怪獸(Derkling)並訓練,與其他玩家進行 battle。
而這些小怪獸其實是貨真價實的 AI:循環神經網絡(RNN)。它具備 30 個輸入、12 個輸出、32 個記憶插槽(memory slot)、1 個隱藏層和 3000 多個參數,能夠「看到」30 多項事物,還能自主決策。
哇,神經網絡這麼 cute 嗎!是不是很想賦予它超能力?
闖關和 battle 勝利,你就可以升級小怪獸的能力和裝備!而這對玩家的挑戰在於:選擇最好的裝備和訓練策略。
在這個遊戲環境中,有大量策略可供探索,玩家可以教小怪獸進行大量嘗試。比如教它們如何治療上單,穿過敵人的隊伍直達敵軍老巢(雕像),或者戲耍對手…… 玩家可以在這裏盡情嘗試和探索不同的策略。
經過多次迭代,小怪獸終於直達敵軍老巢,幹掉了敵方的雕像。
小怪獸升級裝備了,有槍!
這次不再是與遊戲內置的 boss 對戰,而是玩家團戰。看起來戰況很激烈!
Derk 博士使用了哪些技術,幫助小怪獸成長
就整體技術而言,這款遊戲使用的技術類似於 OpenAI Five。OpenAI Five 兩年前打敗了 Dota 2 人類玩家,不過這款遊戲中的小怪獸的腦袋遠不如「OpenAI Five」那麼強悍。
此外,這款遊戲的技術細節還包括:
小怪獸通過 GA 在並行運行的 128 個「競技場」(arenas)上進行訓練;
所有的模擬和神經網絡均在 GPU 上運行,方便快速獲取結果(在一台性能不錯的計算機上 1 分鐘內即可訓練 200 代);
智能體可以和遊戲內置機器人 PK,也可以互相 battle(自對弈),或者將這兩者結合起來;
對於想要深度挖掘小怪獸的「大腦」,充分理解其行為的人而言,這款遊戲提供了不錯的可視化效果。
目前,這款遊戲已發佈到 Steam。
參考鏈接:
https://www.reddit.com/r/MachineLearning/comments/i1o8m0/p_i_created_a_game_for_learning_rl/
https://www.youtube.com/watch?time_continue=27&v;=-Lqb8cce5tk&feature;=emb_logo
https://derkgame.com
【來源:機器之心Pro】
聲明:轉載此文是出於傳遞更多信息之目的。若有來源標註錯誤或侵犯了您的合法權益,請作者持權屬證明與本網聯繫,我們將及時更正、刪除,謝謝。 郵箱地址:[email protected]