會自學的最強阿爾法狗誕生 或突破人類思維束縛

  10月19日電 據《日本經濟新聞》報道,美國谷歌旗下的英國子公司沉思科技(DeepMind Technologies)日前開發出了新版本圍棋用人工智能(AI)“AlphaGo Zero”。

  此前的AlphaGo在擊敗全球頂級棋手時通過學習約3千萬專業棋手的對弈數據使自身變得強大。但AlphaGo Zero無需人類作出示範,也能反覆與自己對弈,藉助自學創造出勝率最高的下法。

會自學的最強阿爾法狗誕生 或突破人類思維束縛

  資料圖:5月25日,目前等級分世界第一的中國棋手柯潔與人工智能“阿爾法圍棋” (AlphaGo)三番棋對決中的第二盤打響,“阿爾法圍棋”持黑先行,柯潔執白。最終柯潔不敵阿爾法圍棋,第二盤告負。

  據報道,以前的AlphaGo對人類就已經具有壓倒性優勢,棋力達到史上最強。這種實力有助於將來在產業方面得到應用,例如通過大量數據自動找到調整電力供需的時機等。

  英國科學雜誌《自然》雜誌10月19日發表了相關文章。谷歌僅向AlphaGo Zero教授了圍棋規則。AlphaGo Zero 將現有的2種學習方法結合起來,分別通過2種方法思考下一手,還能對彼此思考出的結果進行參照。

  據悉,AlphaGo Zero最初是隨機落子,但通過反覆與自己對弈,迅速提高水平。在進行實驗3天后,面對2016年3月擊敗頂級棋手李世石時的舊版AlphaGo取得了100戰全勝。

  據瞭解,人類在多年的圍棋歷史中不斷自主完善了被稱為“定式”的慣用下法。在試驗40天后,AlphaGo Zero已經與自己對弈 2900萬局,強大程度超過2016年5月時面對全球最強棋手柯潔九段取得3連勝的AlphaGo版本。據稱,AlphaGo Zero還開始掌握人類未知的下法。

  美國圍棋協會主席安迪・奧肯等在發給《自然》雜誌的稿件中指出,“AlphaGo Zero在中盤階段的若干判斷簡直就像迷一樣”。另一方面,隨着人工智能和人類在下棋時總結出了相同的定式,證明“人類長達數個世紀的圍棋活動取得的成果並非全部錯誤”。

  沉思科技的首席執行官傑米斯・哈薩比斯在AlphaGo擊敗最強人類棋手時表示,“這是最後一次和人類對弈”。為達成“完全不依賴人類的人工智能”這個目標,哈薩比斯在此後繼續對AlphaGo進行了改進。

  此前,人工智能曾將人類的對弈數據作為“教師”加以學習。因此有觀點指出,人工智能雖然強大,但僅僅處於人類知識的延長線上。沉思科技通過讓人工智能從零開始自學,採用被稱為“沒有教師的學習”方式,創造出了不受人類思維束縛的革新性人工智能。

  哈薩比斯表示,“人工智能有可能推動人類的智力向前發展,給全人類帶來積極影響”。

  報道指出,沉思科技與英國國家醫療服務體系(NHS)展開合作,除了將人工智能用於早期發現疑難雜症外,還將用於調整電力供需等方面。將來,還期待人工智能在依靠人類力量難以解決的新材料開發、探究蛋白質生成機制等方面做出貢獻。

  報道還稱,新技術將來還可能在產業方面做出貢獻。例如,從大量數據中發現人類難以意識到的提升效率的方式等。

  據悉,以各種用電數據為基礎,人工智能將有助於節省電力。由於像AlphaGo Zero一樣的人工智能可以“無師自通”,在宇宙和海洋等觀測數據不足的領域也有可能做出貢獻。

版權聲明:本文源自 網絡, 於,由 楠木軒 整理發佈,共 1338 字。

轉載請註明: 會自學的最強阿爾法狗誕生 或突破人類思維束縛 - 楠木軒