楠木軒

阿爾法狗終極進化, 學習三天成圍棋高手!

由 勞新忠 發佈於 綜合

  0月19日谷歌旗下人工智能研究部門DeepMind發佈了新版AlphaGo(阿爾法狗)軟件,它可以完全靠自己學習圍棋 並且打敗了舊版的AlphaGo(阿爾法狗)。

  不少人都在好奇阿爾法狗這樣的人工智能究竟神奇在哪裏?它未來的應用領域將會在哪裏?學習能力強——它可以通過練習和學習積累更多經驗,這與人類更為相似。

  一個機器,不論是靠計算還是靠向人學習,能夠在局部領域解決問題,就是一種智能。現在通過機器學習和人工神經網絡訓練,機器有了模仿和學習能力,你不需要告訴機器具體的規則是什麼,讓它自己去發現。人臉識別和語音識別技術最近幾年發展很虧,原因就是機器懂得自己去找這樣的特徵。

  AlphaGo的勝利實際上説明了目前的人工智能有了比較好的自我學習能力,就像與柯潔的對弈中,AlphaGo通過大量對弈,把很多不可能的狀態去掉,通過判斷當前形勢,制定當前棋盤下的最佳策略,某種意義上講這與人類有很大相似性。

  人工智能將塑造未來——最終將被用於解決現實世界問題。

  未來DeepMind的人工智能將要應用到哪裏?哈薩比斯認為,“坦白地説,很多領域都可使用人工智能技術,我也很喜歡那樣做。但是限於帶寬的束縛,我們的重點將集中於醫療和推薦系統等。

  實際上,在我們的現實生活中,人工智能已經得到了初步運用,尤其是在教育領域。舉例來看,在考試閲卷中學生四六級的英語作文的試卷已經可以用機器批閲。經過500-1000篇的範文訓練後,大概80%的文章機器可以自動評閲,另外20%非模式化的文章,機器可以挑出來再交給人。這樣可以把老師大量重複模式化的時間節約出來,所以越來越多的學校已經在用這項技術了。

  看了上面的文章,您對教育與人工智能的關係是不是有了更深入的認識和思考呢?對於人工智將來是否會取代人類教師的問題,相信您也有了自己的判斷。


  中關村在線消息:華為於昨天下午在國內召開新品發佈會,推出了HUAWEI Mate 10系列旗艦手機,其中HUAWEI Mate 10 Pro採用6.0英寸18:9顯示屏,屏佔比超過81%,搭載麒麟970人工智能移動計算平台,配備徠卡雙攝像頭。

  現貨搶購

  天貓首發

  徠卡雙攝再進化 曝HUAWEI Mate 10 Pro樣張

  而激動人心的是,在這場發佈會舉行之前,國外著名相機評測機構DoX就已經通過實測對HUAWEI Mate 10 Pro的相機打出了分數,最終其得到了97分的高分,遠遠把蘋果的iPhone8系列甩在了後面。

  而相信大家現在最為好奇的就是華為Mate 10 Pro的相機拍照效果究竟好到什麼程度呢?那就一起通過下面一組官方給出的實拍樣張來一探究竟吧。

  怎麼樣?看完這組由官方給出的HUAWEI Mate 10 Pro實拍樣張,是不是更加心動了呢?

  更多好物在等你新浪眾測·免費送

  推薦閲讀

  聚焦

  應用中心

  新浪公益

  新浪遊戲

  新浪科技

  帶領皇室家族贏得勝利

  靠反應力還不如背賽道

  動腦筋喂小怪物吃餅乾

  輕鬆延長手機續航時間

  練就夢寐以求的好身材

  幫助保持健康生活方式

  隨心所欲打造完美效果

  銀河系最全新番齊放送

  複雜世界裏一個就夠了

  進入機器夢境尋找真相

  瘋狂逃離恐怖的壓碎機

  冰鋒暗影古色廟殿狂奔

  鬥巫師奪回被偷的糖果

  屯兵練兵出征攻佔堡壘

  偽裝胖豬混敵營救夥伴

  幫你一起保護你的頸椎

  隨時隨地輕鬆訂火車票

  瀋陽遭遇六級重度霧霾

  2萬大媽齊跳小蘋果禁煙

  范冰冰傳遞社會正能量

  未富先老養老金吃緊

  益調查:慈善需立法麼

  反虐待動物法制化呼聲高漲

  如何看待廣州擬獎拾金不昧

  環保部即將解決紅頂中介

  明星婚禮上的“善”姿

  “百名春蕾之星”評選

  女孩患尿毒症自籌藥費

  互聯網發展基金會成立

  林青霞為慈善參加節目

  全面實施城鄉大病保險

  兒童安全座椅強制認證

  辦養老院真的是機會麼

  志願者慰問抗戰老兵

  戰艦世界海神節禮包

  亂鬥西遊2新浪獨家卡

  倩女幽魂2夏日特權卡

  功夫熊貓新手高級禮包

  新倩女幽魂新浪特權卡

  靈魂戰神不刪檔測試碼

  我是大主宰新浪榮耀卡

  大話西遊2免費版禮包

  西楚霸王新浪榮耀禮包

  鎮魔曲神兵覺醒尊享卡

  完美國際2一生有你卡

  新天龍八部新手特權卡

  問道經典十年至尊禮包

  大戰神新浪獨家禮包

  熱血傳奇新區獨享禮包

  劍網3萌寵浪浪大禮包

  創世2封測激活碼

  問道手遊媒體禮包

  極限Girl美與野性結合

  讓萌寵當一天司機

  親千萬不要手賤啊

  超級屌的視覺錯覺運動

  地球上最美麗的天堂鳥

  新一代武林最萌小道士

  神奇的PS造錢術

  大開眼界的泡麪新吃法

  讓寶寶嘴饞的菠蘿炒飯

  經典電影鏡頭神級剪輯

  親手教你範爺經典妝容

  盤點全球最糟糕山寨品

  惡搞:當一骷髏在開車

  健身是把整容刀

  三分鐘看盡十年成長

  和TFBOYS一起過暑假

  不用去醫院的牙美白朮

  一分鐘識別面試潛台詞

  Windows 10升級秘籍

  淨水器的水有多深?

  識趣畢業季户外特輯

  有曰:國內外展會吐槽

  三十年經典Moto手機

  ChinaJoy2015大看點

  東芝虛增利潤財務醜聞

  紫光集團收購美光科技

  諾基亞為未來電影造球

  全球APP開發創意大賽

  享説第四期主持人李晨

  獵豹靠近捕食熟睡疣豬

  非洲血腥動物標本加工

  相機拍泡騰片遇水冒泡

  冰島令人窒息美景

  懶惰青蛙蝸牛背搭便車

  美攝影師拍奇怪毛毛蟲

  以下為網友評論:

  網友“輰みるし”:搞不懂屏幕為什麼非得寫成18:9 直接2:1不行嗎 以前的16:9或者是18.5:9那是因為除不盡

  網友“淺愛淺笑”:這後攝像頭就像一排整齊的紐扣,醜的不倫不類

  網友“廣州用户74xxxx416”:為什麼要掉進出貨數量第一這個坑??天天毫無意義的和蘋果三星比!就不問問用華為手機的人,屏幕滿意嗎?系統滿意嗎?攝像頭夠用嗎?耐摔度如何?價格親民嗎?我是吹牛逼嗎?賣手機靠質量還是靠嘴上説的愛國產???

  網友“▓゜只是、想你︶ ̄ ★”:如果真的比蘋果三星好、你特麼還用得着天天來這裏吹牛逼嗎、你見三星蘋果手機什麼時候在哪裏做廣告了

  網友“de”:現在的蘋果各種的被超越吊打,讓人痛心喬幫主的心血就這樣被庫克毀了。

  網友“張濤”:遠遠甩在後面,請問遠遠是多遠?

  網友“真誠的心”:為什麼有些狗就見不得國產貨好,真是鬱悶。

  網友“謝特”:再説一遍,萊卡認證!不是萊卡生產!

  網友“qzuser”:不會又是單反吧?

  網友“折戟沉沙”:表示理解,畢竟p10也是這麼説的,結果被揭穿

  (2017-10-21)


  文|孟永輝

  阿爾法狗在圍棋世界裏打敗眾多高手的事情讓我們對於人工智能未來的發展有了更多期待,然而,這一切並沒有讓DeepMind滿足,他們又如約公佈了有關AIphaGo的研究新論文。在這篇發佈在Nature的新論文裏,DeepMind公佈了他們研發出來的最新最強的版本AlphaGo Zero。

  這款新版的AIphaGo相對於打敗眾多圍棋高手的“前輩”優化了很多,不僅能夠進行純強化學習,而且能夠價值網絡和策略網絡整合成為一個架構,利用3天訓練就能夠以100比0上一個版本的AIphaGo。

  這一消息的公佈再次引發了人們對於人工智能的熱議。AlphaGo Zero的出現説明,在沒有人類輸入的條件下,人工智能能夠藉助自我學習,在加上些許的訓練就能夠形成一套屬於自己的漸進式的性能。新版AlphaGo推出無疑將會成為人工智能的一個全新技術節點,將會為未來無數的AI產業和服務打下基礎。

  同樣地,對AI寄予厚望的金融行業同樣能夠在AlphaGo的身上找到更多有關金融風控、金融審計等方向的優化建議,從而將金融行業帶入到一個真正充滿智能的全新時代。一個以AI應用為代表的全新的金融發展新時代或許正在向我們走來。

  AI逐步發力,金融行業進入智能發展新時代

  儘管AIphaGo大放異彩併為人們所熟知是在圍棋界,但是以百度、谷歌、蘋果為代表的科技公司在無人駕駛上的應用同樣讓人們對於它的未來發展寄予了厚望。除了在無人駕駛領域之外,AI技術與金融行業的融合同樣將會給我們的生活帶來諸多改變。

  以智能投顧為切入點,AI技術將會開啓其在金融行業的應用。以摩根大通、高盛為代表的華爾街金融巨鱷很早就已經藉助AI技術進行投顧方面的工作,2010年和2011年,美國西海岸湧現了第一批robo-adviser機器人投顧,還創造出了現代資產組合理論、馬克維茨模型、均值方差模型(MVO)、Black-Litterman模型等一系列的智能投顧模型。

  以智能投顧為切入點,AI技術已經在金融行業得到了廣泛應用,並積累了很多先進經驗。隨着更多的AI技術被研發和拓展,其在金融行業的應用將會被進一步拓展和提升,由此所帶來的基於金融本身的金融大變革或許終將來臨。

  除了智能投顧之外,AI技術還能夠藉助大數據,通過自主學習形成一套自我漸進式的功能,藉助這些功能,我們能夠除了進行智能投顧和資產匹配之外,還能夠進行智能分發、智能審計等方面的應用,不僅能夠提升金融的運作效率,還能減少人為因素對於金融的影響,促進金融行業更加智能和科學。

  AI的自我進化,將會給金融行業帶來原生髮展動力。自我學習、自我進化是AI技術的一大特點,同樣是AlphaGo帶給我們的最直接的影響。以AlphaGo為代表的AI技術在金融領域的應用以及自我進化無疑能夠讓它能夠藉助300多年的金融先進經驗為當下的金融發展找到更多的突破口,並尋找到除了互聯網技術之外更多的發展動力。

  AlphaGo Zero之所以能夠打敗“前輩”,其中一個很重要的原因就在於它能夠根據以前的經驗進行自我進化和學習,從而形成一套全新的系統,並逐步進化。在金融領域當中,我們能夠讓AI通過學習之前的投資數據、財務數據、項目數據等信息,找到一條基於金融行業本身的AI技術之路,從而為金融行業的發展找到全新的方向。

  這種基於AI技術的全新方式不僅能夠解決金融領域諸多環節人工因素介入較多所帶來的效率低下,成本居高的問題,而且能夠讓金融行業本身形成一個複合自身的發展邏輯,從而帶動金融行業朝着更加智能和科學的方向發展。

  AI與外部技術的融合將會為金融行業發展找到更多突破口。作為一個產業,AI的發展不會僅僅侷限在自身發展,從另外一個層面來講,單單依靠AI本身,它並不能夠獲得更多,更大的發展。“AI+”時代是一個終究都會來臨的時代,在這個時代,我們必須找到AI技術與更多行業的結合點,藉此再將他們與金融行業進行結合,才能最終找到有關金融行業的全新發展突破口。

  試想一下,AI技術通過自我學習就已經有了如此讓人震撼的效果,如果它與其他技術結合呢?AI+大數據、AI+雲計算、AI+生物識別……這些AI技術與外部技術的融合無疑將會為我們拓展金融行業的外部發展渠道找到更多的突破口。

  通過大數據與AI的結合,我們能夠為AI技術找到更多的學習系統,實現AI技術朝着更寬維度和空間的進化,通過將投資者的數據與金融項目的數據實現深度融合,我們能夠實現資產與投資更加精準的配置,減少配置失誤造成的資源利用不當;通過雲計算與AI的結合,我們能夠將原有的基於單一的,獨立行業的計算提升到多維的,多個行業的計算,讓我們的計算結果更加精準,讓金融行業的風控變得更加多維和多元,減少風控片面造成的損失,將金融發展帶入到一個全新時代。

  AlphaGo Zero的出現讓我們對於未來人工智能的發展有了更多期待,以此為基礎,我們或許能夠找到未來金融科技時代發展的更多突破口。那麼,未來金融行業與AI結合之後將會給行業帶來哪些實質性的變革,我們有能夠從這個即將到來的風口找到哪些新的發展方向和贏利空間呢?

  深入金融本身,AI時代的金融行業有哪些機會點?

  通過互聯網金融時代,互聯網技術與金融行業僅僅只是進行簡單的相加相比,在AI時代,由於人工智能本身需要一個學習系統,這個學習系統必須是其與行業深度融合之後才能形成的。所以,AI時代給金融行業帶來的變革或許要比互聯網金融時代帶來的變革要大得多。

  一大批基於金融各流程和環節的AI公司將會出現。正如上文提到的華爾街出現了一批智能投顧為主的公司一樣,隨着AI技術的逐步深化,特別是隨着AI逐步演變成為一個產業,它將會與金融行業融合產生一系列的公司來分食龐大的金融市場。

  智能風控、智能審計、智能項目運營等一大批公司將會出現,並將會持續給金融行業的發展提供源源不斷的發展動力,從而將金融行業的基本元素逐步演變成為以智能為主要代表的存在,從而將金融行業真正變成一個以智能為主要特色的存在。

  通過金融行業的不同環節和流程切入其中,並找到未來更多的發展可能性,優化傳統金融體系,在滿足金融行業發展的同時來維繫自我發展,成為未來AI時代以金融為主要特色的公司發展的主要方向。正是由於這些支撐性的公司加入了AI元素,所以他們提供給金融行業的服務才是智能的,最後金融行業才演變成了一個智能的存在。

  以AI研究和孵化為主的金融公司將會成為一個全新發展風口。金融行業的發展需要更多的AI研究和孵化,找到它與金融行業的真正結合點。單單依靠金融行業本身,很難有精力進行相關的推進,專注於做AI研究和項目孵化的金融公司將會為大型的金融平台提供向對應的服務,並以此來獲得自身的發展。

  通過研究AI技術,找到它與金融行業的結合點,再通過將研究出來的成果提供給各種類型的金融平台,實現AI技術對於金融行業的反哺,進而推動金融行業朝着智能的方向發展,無疑能夠從滿足金融公司的需求當中找到更多的發展增長點。

  隨着金融平台不斷根據業務拓展的需求提出AI研究和孵化的需求,並持續為AI研究和孵化的機構提供數據支撐,這些機構不僅能夠有研究AI的土壤,還能夠通過為這些金融平台提供服務獲得收益。

  AI機器的設計和製造公司將會成為下一個發展風口。相信大家都會注意到搜狗和京東的發佈會上都開始出現了類似於智能機器人的設備,未來隨着AI技術對於金融行業影響的加劇,相信我們還將會在銀行、證券等金融機構看到更多這些智能機器人的影子。

  未來將AI進行具象化的處理,將AI技術進行人像化的表達也將會是一個新的發展風口。通過將已經在線上應用較為純熟的AI技術進行具象化的處理,生產出相對於的智能機器人,通過這種智能機器人來增加人們對於AI技術的感知同樣將會為金融行業科技的發展帶來積極的促進作用。

  除了具象化的智能機器人之外,我們還能夠藉助添加了AI技術的智能硬件的應用來增加金融行業智能元素,從而讓金融行業當中出現更多有關AI技術的應用,通過優化金融機構的硬件設施來提升金融行業的整體AI水平和能力,從而為用户提供具有更多具有AI技術的產品和服務。

  AlphaGo Zero再度引發熱議讓我們看到了未來人工智能發展的諸多方向,一個以AI應用為基礎的產業時代將會來臨。金融行業作為一個率先與AI技術產生深度融合的存在,它在未來的發展過程當中更多的應用AI技術不僅能夠找到破解當下金融發展的困境,而且能夠讓金融行業發展真正進入到全新的智能時代。

  此為億邦專欄作者文章,如要轉載請簽訂內容轉載協議,聯繫run@ebrun.com

  (2017-10-19)


  10月18日,《自然》雜誌網站公佈的論文顯示,此前戰勝人類圍棋世界冠軍的電腦程序AlphaGo的開發團隊又出力作——新程序AlphaGo Zero(阿爾法元)不依靠人類指導和經驗,僅憑自身算法強化學習,就以100:0的戰績擊敗了AlphaGo(阿爾法狗)。

  此消息給世人帶來了不小的震動。此前被AlphaGo 擊敗的世界知名圍棋選手柯潔今早在社交平台上表示:“一個純淨、純粹自我學習的AlphaGo是最強的……對於AlphaGo的自我進步來講……人類太多餘了。”AlphaGo Zero相比與AlphaGo 的更強大之處恰恰在於:“它再也不會受到人類經驗的限制,而是可以不斷向世界上最強的圍棋手——也就是它自己學習到非既定的能力。”

  關於新版阿爾法狗的消息一出,不禁讓人想到了最近《紐約客》的封面文章,描繪這樣一幅未來圖景:一個滿臉鬍鬚的年輕乞丐坐在未來的曼哈頓街上乞討,身旁的機器人向他手裏的杯子裏投擲螺絲和螺帽,他身旁的小狗也滿懷驚訝和擔憂地看着旁邊走過的機器狗。

  幾乎已經不需要想象,人工智能的發展速度將會遠超人類的發展速度,這個新版的阿爾法狗用3天的時間就走完了人類五千年的圍棋發展史,雖然圍棋被稱之為奇淫技巧,但是圍棋也被稱為最高智商的遊戲活動,在這樣的遊戲中人工智能的發展讓人驚愕,更讓人害怕。

  對於未來趨勢的判斷將會是這樣的:

  一是人肉機器人將會很快被真正的機器人取代。隨着科技的高速發展,員工的工作速度更快、效率更高,工作環境也更健康,類似於富士康這樣的快速生產線實際上已經將人類淪為了人肉機器人,但是這些被高度控制的人肉機器人實際上也是會出錯的,現在最大的問題只是人類的使用成本還是比較低的,機器人的使用成本還是相對高昂的,然而隨着摩爾定律的作用,機器人的使用成本一定會快速下降,而隨着人口數量的減少,人類的成本卻在高速上升,所以未來被取代將會是必然。

  二是低端勞動人口的收入會越來越低。根據麻省理工學院的著名經濟學家戴維·奧托爾的研究:“不是工作或者就業崗位本身快要沒有了,而是如果靠自身勞動,那些技能水平比較低的人可能就沒法掙到足夠收入,負擔得起像樣的生活。這點我們已經目睹了。”機器人的普及將會讓工人的工資縮水,讓工廠的就業崗位減少,讓求職者失去市場競爭的能力。

  機器人要來搶飯碗了,你怎麼看?

  (2017-10-19)


  ▎━1━

  【夢外】2017福布斯爸爸們榜上有名

  2017福布斯富豪榜新鮮出爐,比爾蓋茨繼續蟬聯榜首,王健林爸爸以330億美元身價位列中國第一。

  福布斯富豪榜一直為人們津津樂道,曾幾何時與我等草民毫無關係。隨着互聯網時代的發展,我們更關注爸爸們身價多少排名高低。

  中國榜前三依然非常熟悉,馬雲爸爸以282億美元排第二,馬化騰爸爸以245億美元排第三。我可以驕傲自豪的説,爸爸們的財富有我一份貢獻。

  『明天再充十Q幣

  就這麼愉快的決定了』

  【夢裏】富豪爸爸們的生活我不懂,但夢到他們代表好運降臨,會有貴人幫你取得事業成功。夢到自己莫名其妙變成富豪,則有可能是反夢,代表現實中經濟困窘,或近期很急需用錢。

  閲讀《2017福布斯爸爸們榜上有名》,今夜夢到富豪。

  基礎概率:10%

  運勢上升者:12%

  經濟困窘者:18%

  ▎━2━

  【夢外】直播行業縮水誰能笑到最後

  直播行業經歷了短暫的爆發期後,如今數據急劇下滑大家有目共睹。主播越來越少,觀眾越來越少,行業革新迫在眉睫。

  網絡直播紅極一時,巔峯時期每兩個網民中,就有一個人正在看,或看過直播。而現在許多直播平台乾脆關門大吉,幾個大平台活躍用户也急劇下跌。

  任何行業在急速發展背後,都會呈現亂象叢生等狀態。這時候正是優勝劣汰,樹立規範行業規則的大好時機。

  用户對直播的需求不會改變,有內涵有規範的直播平台才註定會笑到最後。

  『喜歡的老鐵

  【夢裏】主播在直播中展示才藝吸引用户眼球。夢到自己當上主播,代表你內心渴望展現自己優秀的一面。

  夢到身邊朋友或親人做主播,而且人氣不錯。一方面代表現實中你很羨慕對方的能力,一方面代表他可能會對你的未來發展有幫助。

  閲讀《直播行業縮水誰能笑到最後》,今夜夢到主播。

  基礎概率:12%

  注重名譽和發展者:15%

  常看直播者:20%

  ▎━3━

  【夢外】人工智能再進化稱霸圍棋界

  人工智能是人類科技發展的不懈追求,我們在無數科幻電影中,設想未來人工智能的無限可能。

  近日,谷歌人工智能團隊宣稱阿爾法狗再進化,最新型只需自主學習3天,便可成為圍棋聖手,並一舉戰勝曾擊敗柯潔、李世石的上代阿爾法狗。

  聽到這個消息,感覺從小學圍棋的朋友們分分鐘哭暈,苦練十年不如機器學習三天,這要上哪兒説理去。

  稱霸圍棋界後,未來人工智能取代人腦的日子,還會遠嗎?

  『未來十年

  人工智能或有重大突破』

  【夢裏】機器人、人工智能曾只是存在於理論中的東西,如今正一點點實現。夢中的機器人,代表你當前仍處於敢打敢拼、富有創新精神的狀態,你的工作事業會逐漸獲得成功。

  閲讀《人工智能再進化稱霸圍棋界》,今夜夢到機器人。

  基礎概率:12%

  事業上升期:15%

  機器人愛好者:18%

  (2017-10-19)


  AlphaGo Zero只用了490萬的數據就達到了AlphaGo的成就。

  [寫在前面]

  倫敦當地時間10月18日18:00(北京時間19日01:00),谷歌旗下的DeepMind團隊公佈了進化後的最強版AlphaGo ,代號AlphaGo Zero。相關論文再次登上世界頂級科學雜誌——《自然》。

  一年多前,AlphaGo便是2016年1月28日當期的封面文章,Deepmind公司發表重磅論文,介紹了這個擊敗歐洲圍棋冠軍樊麾的人工智能程序。也是自那時候起,AlphaGo在全球範圍內掀起了人工智能浪潮。

  那這次的新版本AlphaGo究竟有多厲害?打敗李世石的AlphaGo用了3000萬盤比賽作為訓練數據,AlphaGo Zero用了490萬盤比賽數據。經過3天的訓練,AlphaGo Zero就以100:0的比分完勝對陣李世石的那版AlphaGo。

  在DeepMind的最新論文中,AlphaGo Zero綜合了上一個版本的策略網絡和價值網,利用了強化學習的方法,只用了單一的神經網絡、一台機器和4個TPU,就能在沒有人類指導的情況下,只用3天時間進行學習,打敗了戰勝過李世石的那版AlphaGo。

  看上去如此完美的AlphaGo Zero,在其他人工智能開發者眼裏的表現如何,它對未來人工智能的啓示又有哪些?

  Facebook人工實驗室成員田淵棟在自己的知乎賬號上發表了自己的看法。他認為,DeepMind的新論文要比上一篇好很多,方法非常乾淨標準,結果非常好,以後肯定是經典文章。並且,他非常驚訝AlphaGo Zero竟只用了490萬的數據就達到了AlphaGo的成就。

  田淵棟曾先後在微軟、谷歌、Facebook等科技公司實習工作。他在Facebook的辦公桌離CEO扎克伯格只有6米遠。他所負責的圍棋項目(Darkforest)曾公開得到扎克伯格的表揚,目前他的研究主要集中在遊戲人工智能開發上。

  老實説這篇Nature要比上一篇好很多,方法非常乾淨標準,結果非常好,以後肯定是經典文章了。

  Policy network(策略網絡)和value network(價值網絡)放在一起共享參數不是什麼新鮮事了,基本上現在的強化學習算法都這樣做了,包括我們這邊拿了去年第一名的Doom Bot(編注:Facebook團隊開發的人工智能系統),還有ELF(編注:Facebook人工智能遊戲測試平台)裏面為了訓練微縮版星際而使用的網絡設計。另外我記得之前他們已經反覆提到用Value network對局面進行估值會更加穩定,所以最後用完全不用人工設計的default policy rollout(缺省策略)也在情理之中。

  讓我非常吃驚的是僅僅用了四百九十萬的自我對局,每步僅用1600的MCTS rollout(蒙特卡羅搜樹),Zero就超過了去年三月份的水平。並且這些自我對局裏有很大一部分是完全瞎走的。這個數字相當有意思。想一想圍棋所有合法狀態的數量級是10^170,五百萬局棋所能覆蓋的狀態數目也就是10^9這個數量級,這兩個數之間的比例比宇宙中所有原子的總數還要多得多。僅僅用這些樣本就能學得非常好,只能説明卷積神經網絡(CNN)的結構非常順應圍棋的走法,説句形象的話,這就相當於看了大英百科全書的第一個字母就能猜出其所有的內容。用ML(機器學習)的語言來説,CNN的inductive bias(模型的適用範圍)極其適合圍棋漂亮精緻的規則,所以稍微給點樣本水平就上去了。反觀人類棋譜有很多不自然的地方,CNN學得反而不快了。我們經常看見跑KGS或者GoGoD(編注:兩者均為訓練數據集)的時候,最後一兩個百分點費老大的勁,也許最後那點時間完全是花費在過擬合奇怪的招法上。

  如果這個推理是對的話,那麼就有幾點推斷。一是對這個結果不能過分樂觀。我們假設換一個問題(比如説蛋白質摺疊 protein folding),神經網絡不能很好擬合它而只能採用死記硬背的方法,那泛化能力就很弱,Self-play(自我對弈)就不會有效果。事實上這也正是以前圍棋即使用Self-play都沒有太大進展的原因,大家用手調特徵加上線性分類器,模型不對路,就學不到太好的東西。一句話,重點不在左右互搏,重點在模型對路。

  二是或許卷積神經網絡(CNN)系列算法在圍棋上的成功,不是因為它達到了圍棋之神的水平,而是因為人類棋手也是用CNN的方式去學棋去下棋,於是在同樣的道路上,或者説同樣的inductive bias(歸納偏置)下,計算機跑得比人類全體都快得多。假設有某種外星生物用RNN的方式學棋,換一種inductive bias,那它可能找到另一種(可能更強的)下棋方式。Zero用CNN及ResNet的框架在自學習過程中和人類世界中圍棋的演化有大量的相似點,在側面上印證了這個思路。在這點上來説,説窮盡了圍棋肯定是還早。

  三就是更證明了在理論上理解深度學習算法的重要性。對於人類直覺能觸及到的問題,機器通過採用有相同或者相似的inductive bias結構的模型,可以去解決。但是人不知道它是如何做到的,所以除了反覆嘗試之外,人並不知道如何針對新問題的關鍵特性去改進它。如果能在理論上定量地理解深度學習在不同的數據分佈上如何工作,那麼我相信到那時我們回頭看來,針對什麼問題,什麼數據,用什麼結構的模型會是很容易的事情。我堅信數據的結構是解開深度學習神奇效果的鑰匙。

  另外推測一下為什麼要用MCTS而不用強化學習的其它方法(我不是DeepMind的人,所以肯定只能推測了)。MCTS其實是在線規劃(online planning)的一種,從當前局面出發,以非參數方式估計局部Q函數,然後用局部Q函數估計去決定下一次rollout要怎麼走。既然是規劃,MCTS的限制就是得要知道環境的全部信息,及有完美的前向模型(forward model),這樣才能知道走完一步後是什麼狀態。圍棋因為規則固定,狀態清晰,有完美快速的前向模型,所以MCTS是個好的選擇。但要是用在Atari(雅達利)上的話,就得要在訓練算法中內置一個Atari模擬器,或者去學習一個前向模型(forward model),相比actor-critic((演員評判家)或者policy gradient(策略梯度方法)可以用當前狀態路徑就地取材,要麻煩得多。但如果能放進去那一定是好的,像Atari這樣的遊戲,要是大家用MCTS我覺得可能不用學policy直接當場planning就會有很好的效果。很多文章都沒比,因為比了就不好玩了。

  另外,這篇文章看起來實現的難度和所需要的計算資源都比上一篇少很多,我相信過不了多久就會有人重複出來,到時候應該會有更多的insight(提示)。大家期待一下吧。

  (本文獲田淵棟授權發佈,禁止二次轉載)

  (2017-10-20)


  人工智能上升為國家戰略

  你擔心飯碗會被拿走嗎

  人工智能時代,關於人工智能即將大規模蠶食人類工作崗位的預言一直是熱門話題。

  2017年7月,國務院印發《新一代人工智能發展規劃》(以下簡稱《規劃》),提出面向2030年我國新一代人工智能發展的指導思想、戰略目標、重點任務和保障措施——舉全國之力,在2030年一定要搶佔人工智能全球制高點。

  一石激起千層浪。而第一層浪,就是人們對自己未來工作崗位的普遍憂慮。失業大潮即將洶湧而至了嗎?我們還有多少時間可做準備?

  1、人工智能正在向高端職位進軍

  近日,中國秦皇島一家生產水餃的工廠火了。幾千平方米的廠房裏,竟然看不到一個員工。從和麪、放餡再到捏水餃,到零下50攝氏度條件下的速凍,流水線上的機器人都自如應對。

  無人超市、無人駕駛、無人酒店、無人餐廳……現在,無人工廠終於也來了。

  你可以説,這畢竟是體力勞動的替代,並不會影響到受過高等教育的白領,所以你並不覺得震撼。如果是這樣,那再來看——

  8月8日,九寨溝地震發生18分鐘後,中國地震台網的機器,寫了篇新聞稿,寫作用時25秒。稿件用詞準確,行文流暢,且地形天氣面面俱到,即便專業記者臨陣受命,成品也不過如此。再考慮到25秒的寫作時間,人類完敗了。

  此前,放話“就算阿爾法狗贏了李世石,但它贏不了我”的現世界第一圍棋手柯潔,應戰阿爾法狗。柯潔曾被稱為人類尊嚴的“最後防線”,原因是圍棋的變化極為複雜,即便是計算機也無法窮盡黑白兩子在棋盤裏361個點位上的所有變化。結果,柯潔還是輸了!

  甚至有人在預測,阿爾法狗下一步還會滅了整個金融圈。一個典型的例子是:2000年時,高盛公司在紐約的美國現金股票交易櫃枱僱用了600名交易員。但時至今日,這裏只剩下兩名交易員“留守空房”。

  高盛股票交易員被替代的經歷,只是全球金融公司自動化的一個縮影。現在連貨幣交易,甚至是投資銀行的部分業務也在朝着自動化發展。蘇格蘭皇家銀行,發佈了一個線上的人工智能客服系統,這個客服系統可以根據客户的語調來做出反應,此外,它還不需要休息,更不會要求提供超時津貼。麥肯錫全球研究院在2017年1月推出的一份報告中稱,金融和保險領域的工作,有43%的可能性會被自動化替代。

  人工智能正在向高端職位進軍。有人預言,除了華爾街的交易員,像律師、會計、醫師等高端職位,也將大量地被人工智能所取代。埃隆·馬斯克説在未來20年,全球12%至15%的勞動力將因為人工智能而失業。李開復則認為,10至15年之後,也許50%的人類就可能要面臨工作部分或全部被取代。

  以上這些,有沒有讓你感到有點恐慌?

  2、“還有人會為不能趕馬車而憂慮嗎”

  “可以預計,隨着人工智能的不斷髮展,人工智能對於就業的影響會表現得越來越明顯。”中國人事科學院研究員吳江説,“但當人工智能不斷擊敗最優秀的人類圍棋選手時,我們就可以預計,未來年輕人可能不會再花那麼多時間去鑽研圍棋,而是會去學習更加適應人工智能時代的新知識了。”

  吳江講了這樣一個故事:

  汽車其實是當年最好的一家馬車公司創造出來的。最初,這個公司是把發動機提供的動力用來做馬車輪子。老闆的弟弟不務正業,把發動機裝在馬車輪子上,結果發現可以不用馬了。這在當時是可怕的——全世界那麼多趕馬車的人突然要面臨失業了。雖然現在看來,其實完全沒什麼可擔心的,他們可以去做汽車司機呀,機器畢竟是需要人來操控的。

  早在工業革命浪潮席捲全球時,人機矛盾就已經出現。最初人們都是驚恐的,有人甚至跑去砸機器。“縱觀人類歷史,所有的機器革命,沒有毀滅人類,人創造了機器,同時機器也改變了人。新機器的出現,帶來了大量新的工作,為人類提供了更多的就業機會。”吳江説,“現在,越來越多的人從土地上轉到其他行業,但還有人會為不能趕馬車而憂慮嗎?”

  “如今無人駕駛汽車呼之欲出,老問題又來了,我們還要再為汽車司機的工作崗位擔心嗎?”華夏國際人才研究院院長陶慶華説,從歷史上看,每一次對技術進步的恐慌之後,科技進步為社會創造的就業崗位都遠多於它“殺死”的過時職位。例如,自動櫃員機替代了一些銀行櫃員,但也讓更多僱員進入了機器不能替代的銷售和客服領域。

  “我們必須要承認這個時代我們正在與人工智能軌道融合,未來人工智能將會在大多數領域替換掉人類煩冗而複雜的工作,讓人類減少勞動時間,增加自由時間。”吳江説,“我們每週工作時間已從48小時減少到40小時,未來可能會再減到30小時甚至是20個小時。必要勞動時間少,提升素質和享受生活的時間就長了。最終,勞動者可以從事的新工作,也將由此產生。”

  “現在美國3億多人口中從事農業生產的不到1%,將來工農業直接從業人口降到0.01%也沒什麼好奇怪的。”吳江説,“勞動密集型的時代終將成為歷史。只有從程式化的工作中解脱出來,充滿創新創造活力,活成獨一無二的‘人’,才是我們無可取代的競爭力。”

  3、勞動者也須轉型升級

  “雖然機械性的、可重複的腦力或體力勞動,將被人工智能取代。但會有更多新的、深度的、創意性的人才需求出現。”中國銀行業協會首席經濟學家巴曙松認為,“人工智能時代的到來,必定會產生一些‘沒聽説過’的、‘智能化’的新崗位,比如已經被行業認可的‘自然語言處理’‘語音識別工程師’,以及‘機器人產品經理’等。”

  中國人才研究會學術委員會副主任沈榮華表示,傳統行業的“舊崗位”也需向“人工智能化”發展,如大多數保安、翻譯、記者會被人工智能取代,但剩下的少數人,可能收入會更高,比如能操控安保機器人又有豐富安保經驗的安保負責人,比如垂直於某個細分領域的翻譯人才,比如專門寫深度報道的新聞記者。

  當然,對於“智能代工”催生的新的崗位,並非人人都有機會。“每一輪科技革命都會帶來新一輪工作革命,人工智能將大量淘汰傳統勞動力,很顯然也會有不少行業,會因為人工智能的興起而消亡。”陶慶華説,“但也要看到,人工智能會創造高端的新型的產業需求,從而帶來勞動者的轉型升級。所以,只有新型勞動者,才能適應人工智能時代。”

  陶慶華指出,儘管一些工作崗位被取代的弊端會被全新職位的出現化解,但是19世紀工業革命的經驗表明,轉變過程是極其痛苦的,人口從鄉村大量湧入城市工廠,在當時的歐洲引發持續動盪。各國政府花費了上百年時間構建新的教育和福利體系,才最終適應這種轉變。“這就提醒我們,應提前對兩大挑戰準備好預案:一是如何幫助工作者學習掌握新技能;二是如何讓後代做好知識和思想儲備。”他説。

  這一次的轉變似乎更為迅速,當前科技傳播的速度可比200多年前快多了。“我們必須提前行動,做好迎接新的工作崗位的準備。”陶慶華指出,所幸《規劃》已明確:即日起,從小學教育、中學科目,到大學院校,通通逐步新增人工智能課程,建設全國人才梯隊。“這一要求,既緊迫又必要。是時候,我們要重新思考教育,將其視為一個終身過程。這意味着我們不能再獎勵死記硬背,而應該獎勵好奇心和實驗,它們是發現和理解未知事物的基石。”他説,“如果你想把握未來,現在必須開始有意識提升自己,方能趕上時代的潮流。”

  (本報記者 羅旭)

  (2017-10-19)


  北京時間10月19日凌晨,谷歌旗下的人工智能公司DeepMind在世界頂級科學雜誌Nature雜誌上宣佈了AlphaGo的新進步,可以在沒有人類干預的情況下自我學習,新的AlphaGoZero在自我學習3天之後,就以100比0的成績戰勝了第一代AlphaGo。

  自我學習能力的出現,對於人工智能和機器學習來説,是一個新的突破。“過去人們普遍認為機器學習是基於海量的大數據,但是從AlphaGoZero身上,我們發現算法比數據更重要。”AlphaGo項目的主要負責人戴維·席爾瓦(David Silver)説道。

  也由於使用了更多的算法和更少的數據,所以AlphaGoZero只使用了一台計算機器和4個TPU,被它打敗的一代AlphaGo則用到多台機器和48個TPU。

  當人們驚訝於AlphaGoZero在圍棋領域的神級水平時,對於DeepMind團隊來説,這才只是剛剛開始,他們的目的是通過培養自主學習的能力,來解決更多其他領域目前無法解決的棘手問題。

  從AlphaGo、AlphaGoMaster到AlphaGo Zero

  AlphaGo於2015年10月面世,在廣為人知的與棋手李世石對弈之前,它已經打敗了歐洲圍棋冠軍樊麾。樊麾接受《財經》記者採訪時表示,當時在他看來,一個計算程序要打敗職業棋手是不可能的事情。

  結果他以0-5輸給了AlphaGo,但他也因此加入了DeepMind團隊,幫助訓練AlphaGo。2016年3月,在他幫助訓練下的AlphaGo以4-1的成績打敗了人類頂尖棋手李世石。2017年初,AlphaGo化名為“Master”,在網絡上挑戰60名人類棋手,保持全勝的成績。2017年5月,在烏鎮的,名為Master的第二代AlphaGo以3-0戰勝了目前人類最強棋手柯潔。

  今年5月的比賽期間,DeepMind的多位高管就已經向《財經》記者透露,Master已經實現了自我學習能力,甚至有了自己的“直覺”,“我們發現AlphaGo已經不需要依賴人類訓練師了。”戴維·席爾瓦告訴《財經》記者。

  與柯潔的對弈中,AlphaGo已經能下出很多人類棋手完全無法想象的路數,比賽後柯潔表示,第一代的AlphaGo還能找到破綻,Master已經實現了“從人到神”的飛躍。

  而AlphaGoZero在“獨立”上更進一步,在訓練的過程中,它是自我對弈。從訓練圖上可以看出,由於一開始並不熟悉圍棋,對弈雙方的水平都很弱,但是隨着時間的推進,在短短3天互相博弈490萬局後,越來越強,實現了圍棋水平的突破。

  (圖:AlphaGo訓練的72小時圖譜)

  人類頂尖棋手柯潔被認為是圍棋天才,6歲開始學棋,17歲時在世界範圍內排名第一,一個人類天才十幾年的學習,被AlphaZero用3天時間超越。

  但DeepMind團隊志不在此,“AlphaGo的意義不在於打敗人類,而是領悟知識,解決更多的問題。”戴維·席爾瓦表示。

  商業化加速:1/4精力用於商業變現

  今年5月,DeepMind創始人傑米斯·哈薩比斯在接受《財經》記者採訪時表示:“如果説谷歌是火箭,DeepMind就是燃料。”

  在此定位之下,AlphaGo雖然進化神速,但絕對不會止步於圍棋。

  這家公司一開始只是一家位於英國倫敦的人工智能實驗室,研究方向是開發通用自我學習算法。2011年,哈薩比斯在埃隆·馬斯克等人的投資下,成立了DeepMind。2014年,谷歌以4億英鎊(約6.5億美元)的價格收購該公司,當時這家公司只有50名員工。AlphaGo就來自於這家公司。

  AlphaGo戰勝韓國第一棋手李世石引爆了AI技術和市場,也讓DeepMind在谷歌AI戰略中地位舉足輕重。

  不過,DeepMind團隊從一開始研發AlphaGo系統的目的就是能實現行業應用,並帶來商業價值。圍棋為AlphaGo帶來了光環,卻並非最終目標。

  哈薩比斯對《財經》記者説,“下一階段,DeepMind整個團隊75%的精力用於人工智能技術的研發,另外25%精力放在行業應用上。”

  具體分工上,哈薩比斯繼續主導技術研究,另一位創始人穆斯塔法·蘇萊曼則負責主導商業化。

  穆斯塔法認為,繼續技術研究和商業化是一種平衡。“我們手裏有很多實驗室裏的新技術,都是寶貴的資源,而這些技術的商用不僅能造福社會,一家公司也必須有可持續的商業利潤來源。”他告訴《財經》記者。

  據他介紹,目前DeepMind由兩個團隊組成,哈薩比斯負責研發團隊,而他負責技術應用業務。技術應用團隊又再分為三個組,一個組服務谷歌的產業和谷歌的其他業務部門;第二個是醫療組,已經與英國的國家醫療健康局合作;第三個組是能源組,目前還在啓動階段。

  “這樣的分組是為了方便與不同領域的專家更好地合作。”他説。

  此前,DeepMind已經牛刀小試,成功利用機器學習為谷歌大幅度節約電量,帶來實際收益。

  2016年,DeepMind團隊就利用AlphaGo的學習能力,不斷模擬探索更加省電的方案。DeepMind接管了谷歌數據中心的一些控制單元,包括風扇、空調、窗户和服務器等,通過機器學習,幫助谷歌數據中心的冷卻系統節約用電40%,並提高了15%的能源使用效率。

  哈薩比斯對《財經》記者説:“谷歌在數據中心設備上的用電太多,幾個百分點就意味着每年幾百萬美元,節約電力的算法每分鐘都在給公司省一大筆錢。”

  這個算法團隊的開發團隊僅有5、6個人,耗時僅兩三個月。

  目前,DeepMind的部分研發項目已經開始用於能源基礎設施管理、醫療系統和潔淨水源的改進等方面,公司也已經從中獲得收益。

  DeepMind也已開始進軍醫療市場並從中盈利。2015年11月,它與英國倫敦皇家自由醫院簽訂了為期五年的合同,任務是處理170萬名患者的醫療記錄。

  在這次Nature雜誌上發表的論文中,戴維·席爾瓦也強調了未來的行業應用,例如蛋白質摺疊(用於破譯遺傳密碼)、能量節約以及新材料的研發等等。

  在過去,機器學習未能得到廣泛應用,主要原因之一就在於很多人類無法解決的領域中,也缺少大量的數據樣本來讓機器進行學習,例如醫療圖像處理等。AlphaGoZero能夠擺脱人類的依賴,不需要人類給出數據和樣本,這為更廣泛的行業應用提供了新的可能性。

  這與谷歌成立母公司Alphabet實現組織變身的目的一致。母公司Alphabet創立後,整個企業資產負債表開始分賬計算,業務被獨立出來,明確了職責和成績,提升創新效率。

  一位資本市場分析人士向《財經》記者分析評價,如果一直在之前的架構中,DeepMind對谷歌的技術輸血價值難以清晰衡量,DeepMind也很難有一個明確、長期、符合谷歌戰略的研究目標。

  更重要的一個原因是,資深科學家和強大的計算能力對AI業務的開展固然重要,但DeepMind走出去,獲取真實環境數據同樣重要,這些深入到行業的數據,比如醫療,恰恰是谷歌缺失的數據源。作為一家搜索、社交基因的互聯網公司,谷歌手中的巨量數據,多是開放社交屬性類數據。

  (2017-10-20)


  自古槍兵幸運E,槍兵的代表誰呀,狗狗呀,同樣是狗為什麼阿爾法狗這麼厲害呢,我大狗不要臉的麼。

  北京時間19日1:00,阿爾法狗繼一年之前的再次登上了世界頂級科學雜誌,一年前的阿爾法狗擊敗了歐洲圍棋冠軍樊麾,今年5月擊敗了中國棋手柯潔,給我們留下了震驚之後就宣佈退役,當時還是蠻遺憾的,還想着阿爾法狗能否在其他領域再創輝煌,沒想到成名之後就跑了,可能是DeepMind公司覺得當時的阿爾法狗並不盡如人意,沒有達到自己預期效果吧,所以在之後這家公司繼續進行研究,終於在19日展現了他們的研究成果,號稱最強版阿爾法狗,代號AlphaGo Zero。他不向以前的舊狗一樣是直接把所有的圍棋知識灌輸其內,而是把它做成了一張白紙,從零開始,但是讓人震驚的是自學能力太強了吧,你讓我們這些人類還混不混,3天的時間你就上天了,與李世石對戰的那款阿爾法狗開始PK,100:0的成績你讓那些學了N年的圍棋少年們尷不尷尬,再説了舊狗就不要臉了麼,你這麼欺負舊狗,果然應驗了那句話,自古狗狗幸運E呀。

  阿爾法狗之父説:“最終,我們想要利用它的算法突破,去幫助解決各種緊迫的現實世界問題,如蛋白質摺疊或設計新材料。如果我們通過AlphaGo,可以在這些問題上取得進展,那麼它就有潛力推動人們理解生命,並以積極的方式影響我們的生活。”

  所以在設計的時候對於算法真的做到了精簡以及加強算法,使用了4個TPU芯片,在節約更多的損耗的同時也把需要用到的東西極大加強,可以説是在人工智能領域做出了極大的貢獻,如果説未來人工智能統治全人類,那麼這個公司一定就是罪魁禍首,哈哈,開個玩笑。

  人工智能的發展對於當代的好多領域都起到極大的促進作用,有很多事情需要依靠機器,但是卻很損耗人的精力,也有許多的事情機械式操作,也有很多效率低下的事情,人工智能的發展能夠很好地解決這些方面,能解放出大量的人工成本,讓這些人去做更多其他的事情。

  (2017-10-20)


  在圍棋上,AlphaGo Zero已經到達了人類從未涉足的知識疆域,人工智能進入無師自通的新時代。

  (資料圖)

  《財經》記者賀濤/文王小/編輯

  世界上最強大的圍棋程序誕生了。對,又是AlphaGo乾的。

  這款名叫AlphaGo Zero的新程序,在沒有任何人類數據輸入的情況下,經過短短三天的圍棋自學,就以100比0的戰績打敗了它的“前任”——在2016年擊敗世界冠軍李世石的那款。

  在自我訓練40天后,AlphaGo Zero變得更為強大,超越了AlphaGo的前一版本“大師”,“大師”曾折服了圍棋世界排名第一的柯傑。這是人工智能(AI)領域的一大步。北京時間10月19日凌晨1點,Nature雜誌發表了這篇研究論文。

  算法的升級

  以往所有版本的AlphaGo,都是從利用人類棋手的數據培訓開始。其特點是基於上百萬種專業棋手的下棋步驟,通過“監督式學習”來掌握圍棋。就像培養孩子一樣,通過人類高手數據的“喂招”,加之不斷地反饋,讓AlphaGo成長。

  此外,也使用了基於自我對弈的增強學習。就是不給AlphaGo任何指導,只是告訴它圍棋輸贏的規則,讓它自己下棋,並根據輸贏的結果總結最優策略。

  AlphaGo的創造者、谷歌旗下的DeepMind公司沒有止步於此,而是要探索一種能從零開始、以超人的水平學習複雜概念的算法。於是,AlphaGo Zero誕生了。

  AlphaGo Zero的學習從零開始,且單純基於與自己的對弈,無需任何人類示例或干預。它僅用到一張神經網絡,這張網絡經過訓練,專門預測程序自身的棋步和棋局的贏家,在每次自我對弈中進步。

  當年首款AlphaGo的訓練過程長達幾個月,用到多台機器和48個TPU(神經網絡訓練所需的專業芯片)。而AlphaGo Zero只使用了一台機器和4個TPU,對計算能力的要求降低了一個數量級,而棋力水準反而得到躍升。這表明,算法比所謂的計算能力或數據可用性更重要。

  延伸出新的知識邊疆

  AlphaGo Zero還帶來了更大的彩蛋。

  “它總結出一些人類目前尚未發現的東西,形成一些極具創意的新知識。” AlphaGo項目的主要負責人戴維·席爾瓦(David Silver)説。AlphaGo不僅在短時間內重新發現了人類經過上千年總結出來的所有圍棋知識,如先在角落裏落子,它還獨創了自己的下法,有些下法甚至是人類從未觸及的。

  中國科學院計算技術研究所研究員張雲泉對《財經》記者分析,人類棋手為了降低計算需求和追求棋形之美,通過定式等手段對圍棋下法進行了大量的簡化和限制,從而錯失了很多有效的下法,AlphaGo Zero代替人類探索了圍棋世界的巨大的空間。

  這正是AlphaGo Zero驚人的地方。隨着知識和數據的爆炸,人類已經沒有能力學習和掌握所有的新知識並進行創造,而AlphaGo卻做到了。作為人類的新知識的助手,去探索發現和總結目前人類能力無法到達的新的知識空間。

  “它可以延伸人類探索發現新知識邊疆的能力!”張雲泉説。這預示着機器學習將正式進入無師自通時代,一個新時代已經到來。

  需要明晰的是,這並不代表有了AlphaGo Zero,人類經驗就沒用了,人工智能已經超過人類智力。

  中國科學院自動化研究所複雜系統管理與控制國家重點實驗室主任王飛躍認為,在所有“規則界定得非常清楚,而且規則中包含了所有信息”的任務中,機器或程序都應超過人類。正如汽車會跑得比人快,飛機會飛得比人高。圍棋屬於這個範疇。

  問題是,人工智能在應用中面臨的更多挑戰是那些規則不清,或者清楚但不包含所有信息的事情。在軍事國防、社會經濟,特別是日常生活中,大多數應用場景都屬於此類,即使人為界定出來的規則可以簡化複雜性,但無法確定所有信息。比如,交通規則無法杜絕交通擁堵和事故的發生。也就是説,在目前大多數應用場景下,人工智能還無法超越人類智力。

  成功要複製

  DeepMind公司的使命感很強,他們希望首先解決人工智能問題,然後用人工智能去解決一切其他問題。

  顯然,研發出AlphaGo Zero不會讓它僅坐在圍棋王座上。

  最讓戴維·席爾瓦驚喜的,也是它在現實世界裏的應用前景。AlphaGo Zero在圍棋這個複雜、高挑戰的領域能夠達到極高水平,意味着可以將它從圍棋領域移植到其他領域,建立一種普遍算法,來着手解決對人類來説最棘手、影響最大的難題了。

  “最終,我們希望將這種算法上的突破,用於幫助解決現實世界各種的緊迫問題,如蛋白質摺疊、設計新材料。如果我們能在這些問題上做出同樣的進步,AlphaGo就有潛力推動人類的知識,並對我們的生活產生積極的影響。”DeepMind聯合創始人兼首席執行官戴密斯·哈薩比斯(Demis Hassabis)説。

  (2017-10-20)