神經網絡變成小怪獸，這款遊戲用最簡單的方式訓練神經網絡

2020-08-04由鍾離綺琴發佈於科技

機器之心報道

編輯：魔王

在遊戲裏訓練「神經網絡小怪獸」，學習強化學習！

想了解神經網絡，但不知道如何入手？教程太枯燥，論文不好懂？

別怕，這裏有款多人在線戰術競技遊戲（MOBA），讓你在西部牛仔的世界中訓練自己的神經網絡。在這裏，所有「智能體」都是類似怪獸的生物，還有武器！

故事的背景是：Derk 博士想要創建一個具備「神經網絡」大腦的生物。

這款名為「Dr. Derk's Mutant Battlegrounds」的遊戲是一個基於 AI 的實驗性遊戲。玩家的任務是武裝自己的小怪獸（Derkling）並訓練，與其他玩家進行 battle。

而這些小怪獸其實是貨真價實的 AI：循環神經網絡（RNN）。它具備 30 個輸入、12 個輸出、32 個記憶插槽（memory slot）、1 個隱藏層和 3000 多個參數，能夠「看到」30 多項事物，還能自主決策。

哇，神經網絡這麼 cute 嗎！是不是很想賦予它超能力？

闖關和 battle 勝利，你就可以升級小怪獸的能力和裝備！而這對玩家的挑戰在於：選擇最好的裝備和訓練策略。

在這個遊戲環境中，有大量策略可供探索，玩家可以教小怪獸進行大量嘗試。比如教它們如何治療上單，穿過敵人的隊伍直達敵軍老巢（雕像），或者戲耍對手…… 玩家可以在這裏盡情嘗試和探索不同的策略。

經過多次迭代，小怪獸終於直達敵軍老巢，幹掉了敵方的雕像。

小怪獸升級裝備了，有槍！

這次不再是與遊戲內置的 boss 對戰，而是玩家團戰。看起來戰況很激烈！

Derk 博士使用了哪些技術，幫助小怪獸成長

就整體技術而言，這款遊戲使用的技術類似於 OpenAI Five。OpenAI Five 兩年前打敗了 Dota 2 人類玩家，不過這款遊戲中的小怪獸的腦袋遠不如「OpenAI Five」那麼強悍。

此外，這款遊戲的技術細節還包括：

小怪獸通過 GA 在並行運行的 128 個「競技場」（arenas）上進行訓練；

所有的模擬和神經網絡均在 GPU 上運行，方便快速獲取結果（在一台性能不錯的計算機上 1 分鐘內即可訓練 200 代）；

智能體可以和遊戲內置機器人 PK，也可以互相 battle（自對弈），或者將這兩者結合起來；

對於想要深度挖掘小怪獸的「大腦」，充分理解其行為的人而言，這款遊戲提供了不錯的可視化效果。

目前，這款遊戲已發佈到 Steam。

參考鏈接：

https://www.reddit.com/r/MachineLearning/comments/i1o8m0/p_i_created_a_game_for_learning_rl/

https://www.youtube.com/watch?time_continue=27&v;=-Lqb8cce5tk&feature;=emb_logo

https://derkgame.com

【來源：機器之心Pro】

聲明：轉載此文是出於傳遞更多信息之目的。若有來源標註錯誤或侵犯了您的合法權益，請作者持權屬證明與本網聯繫，我們將及時更正、刪除，謝謝。郵箱地址：newmedia@xxcb.cn