阿爾法狗進化成功最強人工智能誕生

　　1997年，國際象棋神話卡斯帕羅夫輸給了計算機，圍棋便成為人類的最後尊嚴。但阿爾法狗（AlphaGo）擊碎了這一夢想。

　　倫敦當地時間10月18日，最強版阿爾法狗橫空出世，代號AlphaGoZero。

　　阿爾法狗（AlphaGo）是谷歌研發的一款圍棋人工智能程序。

　　阿爾法狗誕生以來，賽績顯著，所向披靡，一度橫掃國際圍棋界。我們來看看它的賽績：

　　2015年10月，它以5：0完勝歐洲圍棋冠軍、職業二段選手樊麾。

　　2016年3月，挑戰世界圍棋冠軍、職業九段選手李世石。最後以4:1結束了這場“戰爭”。

　　2016年12月29日晚起到2017年1月4日晚，它以“master”的身份接連“踢館”弈城網和野狐網，對戰人類頂尖高手，戰績是60勝0負。

　　2017年5月23日-27日，在“中國烏鎮·圍棋峯會”上三勝柯潔，賽後便宣佈退役。

　　柯潔落敗淚灑賽場

　　不再受人類知識限制，自我訓練3天成頂級高手

　　時隔不久，進化後的阿爾法狗捲土重來，令人震驚的是，它的獨門秘籍，是“自學成才”。

　　“阿爾法狗”和“阿爾法狗零”的最大區別是：“阿爾法狗”結合數百萬人類圍棋專家的棋譜，進行了自我訓練。

　　“阿爾法狗零”則不再需要人類數據，也就是説，它一開始就沒有接觸過人類棋譜。研發團隊只是讓它自由隨意地在棋盤上下棋，然後進行自我博弈。而且，它是從一張白紙開始，零基礎學習，在短短3天內，就成為頂級高手。

　　人工智能會取代人類嗎？

　　此前，物理學家史蒂芬·霍金在參加2015時代精神會議上曾提出警告：人工智能可能會導致人類的滅絕，並且進一步表示：“人工智能計算機可能在接下來的100年之內就將人類取而代之。”

　　谷歌首席科學家YoavShoham卻認為：未來人與機器的界限會越來越模糊，當人和機器融為一體了，就不存在機器會取代人的一個過程。

　　這顯然是人類希望的人工智能技術的最理想的一個發展新方向，人類像以往使用水電煤一樣將人工智能作為一種工具或資源進行使用，人類藉此繼續進化成為超人，繼而繼續主宰整個世界。

　　而這時問題又來了？人類藉助人工智能進化時會是同步一起進化嗎？如果不是的話，那對於人類該何去何從？

　　8 月 11 日，人工智能又給人類帶來了驚喜，伊隆·馬斯克（Elon Musk）旗下的人工智能研究機構OpenAI 宣佈他們所打造的一個 AI 機器人已經在電子競技遊戲 Dota 2 中擊敗了一個名為 Dendi 的人類職業玩家，而比賽所採取的形式也是很直接的 1v1。

　　雙方約定好共進行三輪比賽，在第一場比賽中，人工智能在不到十分鐘的時間內閃電擊敗對手；第二場比賽同樣也是由人工智能取得了勝利；而這直接導致了 Dendi 放棄進行第三場比賽。

　　圖丨被AI打敗的Dota2最強人類選手Dendi

　　“這個傢伙很可怕，”Dendi 在比賽中倒吸了一口冷氣。

　　圖丨馬斯克第一時間轉發了OpenAI獲勝的消息

　　OpenAI 官方解釋説，這款 AI 機器人是完全通過自我訓練出來的，研究人員從零開始通過過往的比賽視頻來對它進行訓練。OpenAI 的 CTO 格雷格·布羅克曼（Greg Brockman）表示，訓練僅僅花費了兩週的時間，AI 就已經擊敗了包括世界排名第一在內的頂級 1v1 選手。

　　Brockman 補充道，“通過 1v1 這種形式的訓練，我們已經針對 AI 的優勢和劣勢進行了針對性的訓練。”接下來，OpenAI 將訓練 AI 一次扮演 5 個選手，這樣就可以組成一個完整的戰隊了。同時，他們還準備將這款 AI 對外開放，讓所有人都有機會和人工智能進行對戰。

　　而人工智能介入遊戲領域也並非新鮮事，包括 DeepMind 和 Facebook 都已經針對即時戰略遊戲“星際爭霸2”開展了探索之路，他們收集大量的人類玩家遊戲比賽記錄數據，並用這些數據來訓練深度學習算法，最終可以做到在人機大戰中擊敗人類選手。

　　就在 8 月 10 日，DeepMind 聯合暴雪公司正式推出合作開發的星際爭霸2機器學習工具組：SC2LE（星際2學習環境），雙方希望通過這些工具，幫助研究人員加快星際爭霸 2 AI 的開發速度。

　　SC2LE 包括：

　　一個由暴雪開發的機器學習API，為研究人員和開發者們提供接入遊戲的端口。其中將首次完整包含為Linux系統開發的工具。（GitHub 地址：https://github.com/Blizzard/s2client-proto）

　　DeepMind的工具集PySC2的開源版，讓研究人員可以輕鬆地在各自的模型中使用暴雪的特徵層API。（GitHub 地址：https://github.com/deepmind/pysc2）

　　一系列小遊戲，讓研究人員可以對自己系統的性能進行真實的測試。

　　一個含有6萬5千局匿名遊戲的數據集，並將在接下來的幾周裏擴展至50萬局遊戲以上。

　　一篇介紹整個環境並提供基線成績的論文。基線成績是由小遊戲，從遊戲回放進行的監督學習，以及與星際2 自帶的電腦對手進行單挑的結果得出的。（論文地址：https://deepmind.com/documents/110/sc2le.pdf）

　　當然，星際爭霸 2 還有一些難題暫時沒有技術手段解決，比如“戰略”。作為一個戰略遊戲，很多時候，玩家做出的決定往往只會在十幾甚至幾十分鐘之後才會產生效果。因此，為了讓 AI 學會“戰略”，它必須擁有“計劃”和“記憶”的能力。“存儲是至關重要的”，DeepMind 星際爭霸 2 項目的負責人Oriol Vinyals 説道。

　　而由於遊戲的長度，DeepMind善用的加強學習卻並不適合星際爭霸 2，“我現在做出的操作可能在很久之後才有後果”，Vinyals説道。由於現有的技術手段無法攻克這一難題，DeepMind 希望降低開發星際爭霸 2 AI 的門檻，集眾人之力開發出新的技術手段，解決“戰略”難題。

　　可以説，DeepMind 和暴雪聯合開發的工具一舉打開了通往終極星際爭霸2 AI 的大門。目前，已經有數名世界頂級星際2選手表示，願意與AI一戰。

　　除了星際爭霸2，更值得一提的就是在此之前火遍全球的“AlphaGo”熱潮，在圍棋這個最複雜的棋盤遊戲中，人工智能已經將包括柯潔在內的人類最頂尖的棋手都一一擊敗，這甚至在當時還一度使“AI威脅”的論點甚囂塵上。

　　圖丨馬斯克認為 Dota2 的難度比象棋和圍棋大得多

　　雖然我們還無法評價 OpenAI 的這次實驗與 Facebook 和 DeepMind 打造的“星際爭霸II” AI 以及 DeepMind 的圍棋 AI AlphaGo 孰優孰劣。但到目前為止，的確還沒有人工智能研究團隊可以擊敗人類遊戲玩家，OpenAI 算是開了個先河。

　　不過，這對於人類來説可能就沒有那麼樂觀了，“感覺它就像人類選手一樣，但又有人類所不具備的優勢，”Dendi 對 OpenAI 的人工智能做出了這樣的評價。

　　(2017-08-12)