會自學的最強阿爾法狗誕生或突破人類思維束縛

2017-10-19 由舒培榮發佈於綜合

　　10月19日電據《日本經濟新聞》報道，美國谷歌旗下的英國子公司沉思科技(DeepMind Technologies)日前開發出了新版本圍棋用人工智能(AI)“AlphaGo Zero”。

　　此前的AlphaGo在擊敗全球頂級棋手時通過學習約3千萬專業棋手的對弈數據使自身變得強大。但AlphaGo Zero無需人類作出示範，也能反覆與自己對弈，藉助自學創造出勝率最高的下法。

　　資料圖：5月25日，目前等級分世界第一的中國棋手柯潔與人工智能“阿爾法圍棋” (AlphaGo)三番棋對決中的第二盤打響，“阿爾法圍棋”持黑先行，柯潔執白。最終柯潔不敵阿爾法圍棋，第二盤告負。

　　據報道，以前的AlphaGo對人類就已經具有壓倒性優勢，棋力達到史上最強。這種實力有助於將來在產業方面得到應用，例如通過大量數據自動找到調整電力供需的時機等。

　　英國科學雜誌《自然》雜誌10月19日發表了相關文章。谷歌僅向AlphaGo Zero教授了圍棋規則。AlphaGo Zero 將現有的2種學習方法結合起來，分別通過2種方法思考下一手，還能對彼此思考出的結果進行參照。

　　據悉，AlphaGo Zero最初是隨機落子，但通過反覆與自己對弈，迅速提高水平。在進行實驗3天后，面對2016年3月擊敗頂級棋手李世石時的舊版AlphaGo取得了100戰全勝。

　　據瞭解，人類在多年的圍棋歷史中不斷自主完善了被稱為“定式”的慣用下法。在試驗40天后，AlphaGo Zero已經與自己對弈 2900萬局，強大程度超過2016年5月時面對全球最強棋手柯潔九段取得3連勝的AlphaGo版本。據稱，AlphaGo Zero還開始掌握人類未知的下法。

　　美國圍棋協會主席安迪・奧肯等在發給《自然》雜誌的稿件中指出，“AlphaGo Zero在中盤階段的若干判斷簡直就像迷一樣”。另一方面，隨着人工智能和人類在下棋時總結出了相同的定式，證明“人類長達數個世紀的圍棋活動取得的成果並非全部錯誤”。

　　沉思科技的首席執行官傑米斯・哈薩比斯在AlphaGo擊敗最強人類棋手時表示，“這是最後一次和人類對弈”。為達成“完全不依賴人類的人工智能”這個目標，哈薩比斯在此後繼續對AlphaGo進行了改進。

　　此前，人工智能曾將人類的對弈數據作為“教師”加以學習。因此有觀點指出，人工智能雖然強大，但僅僅處於人類知識的延長線上。沉思科技通過讓人工智能從零開始自學，採用被稱為“沒有教師的學習”方式，創造出了不受人類思維束縛的革新性人工智能。

　　哈薩比斯表示，“人工智能有可能推動人類的智力向前發展，給全人類帶來積極影響”。

　　報道指出，沉思科技與英國國家醫療服務體系(NHS)展開合作，除了將人工智能用於早期發現疑難雜症外，還將用於調整電力供需等方面。將來，還期待人工智能在依靠人類力量難以解決的新材料開發、探究蛋白質生成機制等方面做出貢獻。

　　報道還稱，新技術將來還可能在產業方面做出貢獻。例如，從大量數據中發現人類難以意識到的提升效率的方式等。

　　據悉，以各種用電數據為基礎，人工智能將有助於節省電力。由於像AlphaGo Zero一樣的人工智能可以“無師自通”，在宇宙和海洋等觀測數據不足的領域也有可能做出貢獻。