張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

整理 | 夕顏

【導讀】7 月 3-4 日,由 CSDN 主辦的第三屆 AI 開發者大會(AI ProCon 2020)在線上舉行。本次大會有超萬人報名參與,參與人群覆蓋 50+ 領域、4000 家企業。其中有來自行業內 70+ 頂尖企業、開源社群與科研高校的近 100 位行業領袖、技術大咖與研究學者。

他們用更新鮮、更有趣、更年輕的方式,聚焦智慧時代 AI 技術的發展曲線以及 AI 與社會各行業結合的最新應用進展,深入解析熱門 AI 技術在行業中的實踐與落地經驗,揭示技術與行業發展面臨的機遇與挑戰。

在 7 月 3 日的主論壇上,清華大學人工智慧研究院院長、中國科學院院士張鈸帶來了《人工智慧的發展現狀與人才培養》的主題演講。

核心觀點:人工智慧經歷了兩種發展正規化:符號主義和連線主義,我們分別稱之為第一代和第二代人工智慧,這兩種正規化發展至今都遇到瓶頸,從而觸及天花板。今後發展的方向是第三代人工智慧,這是一條前人沒有走過,需要大家去探索的道路,將對科學研究、產業化和人才培養產生重大影響。

我是清華大學人工智慧研究院的張鈸。大家知道,人工智慧的發展歷經兩種發展方式,一個是符號主義,另一個是連線主義,我們把符號主義叫做第一代人工智慧,把連線主義叫做第二代人工智慧。但是這兩種發展模式/發展方式今天都遇到了瓶頸,觸及了天花板。今後發展的方向是第三代人工智慧,而這是一條前人沒有走過的,需要大家去探索的道路。

第三代人工智慧的發展將對科學研究產業化和人才培養有什麼影響呢?下面我們來具體說明。

第一代人工智慧-符號主義

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

第一代人工智慧就是大家所說的符號主義,實際上它是建立了一個知識和推理的模型,來模擬人類的理性的智慧。在具體應用上,就是利用了知識和推理,構造化學結構分析系統、計算機硬體組合系統、血液傳染病診斷處方等系統。

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

我們回過頭來看,會發現建立MYCIN醫療診斷專家系統,其實就是把傳染病專家的知識和經驗放在知識庫中,把醫生看病的過程,如何從症狀推斷疾病,再推理出處方的推理機制放在計算機中。這樣,內科醫生透過與計算機的互動,就可以透過計算機幫助他/她來診斷血液傳染病。

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

這種用知識和推理建立的模型,主要是用來模擬人類的理性智慧,它的代表性成果是國際象棋。國際象棋是完全資訊博弈,實際上與決策、規劃、診斷、設計和排程等,都屬於理性智慧/理性分析。這個系統打敗了人類國際象棋冠軍卡斯帕諾夫,這就說明這樣的系統在一定的條件下能夠超過人類的水平。

這種系統成功的秘訣在什麼地方?也就是說第一代人工智慧成功的秘訣,主要有下面三個因素:

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

一是依靠知識和經驗。以IBM深藍為例,它分析了70萬盤象棋大師下過的棋,還有全部5~6個棋子的殘局。根據這些殘局和大師下過的棋,總結出來下棋的規則。同時又透過大師和機器的對弈,對有8000個引數的評價函式進行調整,這樣就可以把大師的經驗也放到程式裡。

第二個因素是演算法。當時深藍主要常用採用的是α-β剪枝演算法。

最後一個是算力,當時深藍使用的是IBM RS 6000 SP2,大體上每秒鐘可以分析2億步,平均來講是每分鐘能夠搜尋8-12步。

第一代人工智慧的優勢

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

我們看一下第一代人工智慧的優點。它可以模仿人類的理性智慧。首先,它可以解釋,可以和人類一樣基於知識進行推理,我們不僅可以用來作為理性分析的模型,同時基於知識也可以用來進行機器學習。

這種基於知識的符號學習,可以克服基於資料驅動機器學習方法的缺陷,也就是深度學習方法的那些缺陷,比如不可解釋性,推廣能力很弱,需要大量的資料等。

第一代人工智慧的侷限性

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

但是,第一代人工智慧最主要的侷限性,體現在它不能隨機應變,即基本上只能解決完全資訊和結構化環境下的確定性問題。比如下國際象棋就是一個完全資訊的,並按照一定規律演化過程。

另外,無論是IBM的深藍,還是MYCIN醫療診斷系統,所有的知識都是用人工來編制的,所以在知識自動獲取和表示上目前還有一些困難。此外,還有一個侷限性是涉及到不確定性的知識與推理,第一代人工智慧還沒有很好的解決辦法,導致其應用的範圍有限。

第二代AI——深度學習

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

第二代人工智慧,也就是我們現在非常熟悉的深度學習,有時也被稱為亞符號模型,或者連線主義方法。

它實際上是透過模擬人類的神經元、神經系統的機制來模擬人類的感性智慧/感知(主要),其基本方法如圖左所示,把影象/語音直接輸入到人工神經網路中。所謂人工神經網路實際上就是一個演算法,對輸入的資訊進行分類,比如這個影象究竟是馬還是牛。

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

因此,深度學習在模式識別上,就是將原始輸入資料進行分類,其重要特點是不需要領域知識。過去我們要識別一幅影象,必須人工選擇合適的特徵。有了深度學習以後,把原始影象的畫素輸進去就可以識別。

這說明在深度學習中,我們不需要影象相關的知識和語音知識,直接把影象和語音的原始訊號輸進去就可以,這就使得使用門檻降低,沒有專業知識的人也可以使用深度學習。

第二代人工智慧的第二個優點是,因為深度學習是使用多層神經網路,這就賦予其強大的學習能力,因此能夠處理大資料。

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

最後,深度學習第二代人工智慧主要依靠三個要素:資料、算力,還有演算法。使用深度學習以後可以解決很多實際問題,比如影象識別、語音識別的識別率有了大幅提升,2011年在IBM和微軟在ImageNet上的影象誤識率為50%,4年之後使用深度學習後誤識率降到3.57%,實際上超過人類的水平。

第二代人工智慧的侷限性

但是第二代人工智慧也有很大的侷限性,最重要的是不能舉一反三。

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

首先,它不可解釋,也就是說它可以分辨牛或馬,但是我們不知道它的根據,因為這是根據多層神經網路計算得出的結果。第二點是不安全,非常容易受攻擊。第三是不易推廣,最後一點是需要大量樣本來學習。在視覺領域的安全性尤其令人擔憂。

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

比如左邊第一張圖是一個停止的交通訊號,我們只要在交通指示牌上加入一點噪聲,圖中是加上了幾個白塊和黑塊,它卻識別為限速45公里。再比如在圖中最左邊的坦克側面塗上一些顏色,機器就將其誤識別為校車。這說明,利用深度學習來構造的影象識別系統非常不安全,非常容易受攻擊。

人工智慧產業現狀:大部分不盈利、應用場景有限

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

利用第一代人工智慧技術和第二代人工智慧技術構造的系統有什麼問題?用這些技術來進行產業化目前的現狀是怎樣的?

我們可以看到,目前人工智慧在很多領域得以應用,包括交通、醫療、安保、智慧城市、家庭服務、智慧製造、金融等,同時可以看到這些領域中的人工智慧企業數量很多,但是規模很小,大多數是幾十人到幾百人的規模,千人以上的大企業很少。

人工智慧產業的第二個特點是大部分沒有盈利。原因就在於第一代人工智慧和第二代人工智慧技術的侷限性,主要表現在兩個方面,一方面是現有技術的應用場景有限,只能應用到那些結構化、靜態的環境中,比如把現有的第一代和第二代人工智慧技術應用到自動駕駛場景中時,如果交通狀況比較複雜,就很難應用。

第二是技術本身有侷限性。所以,為了使得人工智慧的研究工作有進展,特別是為了讓企業做大做強,我們必須要發展第三代人工智慧的理論和技術。

邁向第三代人工智慧需要突破一些理論、方法與關鍵技術

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

第三代人工智慧理論和關鍵技術主要為以下三點:

第一,我們必須要探索出可解釋和魯棒的人工智慧理論。換句話講,現在的第一代和第二代人工智慧都不夠好用怎麼辦?第二個就是要發展安全、可信、可靠和可擴充套件的人工智慧技術,從而推動人工智慧的創新應用。

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

第三代人工智慧的優點有哪些?

如前所述,第一代人工智慧符號主義的模型依靠的是知識、演算法和算力。第二代人工智慧,即亞符號模型/連線主義模型主要依靠的是資料、演算法和算力。我們現在發展第三代人工智慧,最主要的措施就是把第一代人工智慧知識驅動的方法和第二代人工智慧資料驅動的方法結合起來,這就可以使我們充分地利用4個要素——知識、資料、演算法和算力,特別是演算法,即如何去研究新的理論和方法。

下面介紹一下這方面的工作。

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

在第一代人工智慧中,我們做過的一些專家系統,但這些專家系統的規模都比較小,實用性較差。那麼我們現在介紹一下在這個方向上做的努力,最典型的代表是美國的沃森系統。

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

大家知道沃森系統是一個很成功的人工智慧系統,它在全美的電視智力競賽中打敗兩個全美冠軍。它與第一代人工智慧相比不同之處在哪裡?

當時要建立專家系統,主要的知識和經驗來自於專家,比如MYCIN系統傳染病的診斷系統,它的知識主要來自於傳染病專家。而專家知識是非常昂貴和稀缺的,而且要把專家的知識表示在計算機中,非常耗時耗力,即使是規模不大的MYCIN系統也需要三年才能做出來。主要的挑戰是如何擴大人工智慧的規模,使其更加實用化,最重要的方法是引進大量的資料。

網路上有大量的非結構化的資料,我們如何自動地把這些非結構化的資料變成計算機可用的語料庫,這個問題在沃森系統裡得到很好地解決。

有了大量的語料庫後,沃森可以利用多種推理機制來解決“問答”的問題,經過對“問題”進行分析與分解,從語料庫中找出候選答案,對候選答案進行評分和排序,最後輸出問題的答案。

人工智慧改變醫療行業

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

人工智慧應用中另一個大的問題是如何使人工智慧技術更加可靠、可信。以醫療系統為例。“醫療”主要有三個要素——醫務人員、病人和醫療裝置和醫療技術。隨著醫療技術的發展,醫生可以利用先進的裝置和技術對病人進行更加高效、準確的診斷。

即使裝置和技術有巨大的變化,醫務人員和病人的關係始終沒有變,也就是說醫務人員利用裝置和技術為病人治病,所有責任都在醫務人員身上,所以病人去看病,主要取決於對醫務人員的信任。

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

裝置技術智慧化會對醫務人員和病人關係起到什麼作用呢?由於智慧化的裝置和技術也參與到診斷過程和疾病的分析過程,這樣就產生一個問題,病人和醫務人員是否信任裝置和技術做出的診斷和決策。所以,當裝置智慧化以後,我們需要建立一套互信、可靠、高效執行的新醫療系統。

目前的技術,包括人工智慧技術,還不足以建立起醫生、患者和機器三者之間的信任關係。以醫學影象識別為例,假如計算機分析 x光片,診斷出病人患有肺癌,但是目前用深度學習方法做出的診斷是不可解釋的,醫生也無法信任這個結果。所以,只有解決了深度學習影象識別不可解釋的問題,才可以建立起病人對診斷結果的信任。

換句話講,我們要想讓這些人工智慧技術在醫學診斷中發揮更大的作用,就必須提高它的可信度、可靠性和可解釋性等。

張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才!

另外,機器人在服務行業、製造業中有大量應用,比如手術機器人。可以看到,這些機器人的應用場景基本上是結構化的環境,即環境基本上是固定不變的,服務機器人目前在這個領域的應用較多。但是像自動駕駛工作在非結構化環境下,應用就困難得多。所以,我們要想讓機器人在更多的領域中應用,也必須解決隨機應變等魯棒性等問題。

我們需要勇闖無人區的創新人才!

以上是人工智慧的發展現狀,從發展現狀出發,我們來分析一下未來對人工智慧人才培養的要求。

首先,目前發展到第一代和第二代人工智慧,我們遇到了瓶頸,需要發展新的第三代人工智慧,大家都在探索一條前人都沒有走過的道路,因此,無論是對科學研究、開發還是產業來說,都需要有從0~1的創新,因為我們沒有辦法沿著前人已經走過的路走,所以,技術人員、開發人員和企業家要有一種精神,敢於闖無人區,這是一個很重要的要求。

第二,技術人員,包括管理人員不僅要能夠解決問題,更重要的是能提出問題和發現問題。在大學和研究生培養計劃下,我們的重點都是在培養解決問題的能力,而在發現問題和提出問題上有所不足。因此,對這樣的人才培養必須是提出問題和解決問題的能力並重。

第三,能夠理論與實際結合技術和產業結合

最後,人才不限於科技人才,還包括管理人才,人工智慧企業要想做大做強,必須很好地把資本市場和技術結合起來。因此,我們不僅要培養科技人才,也需要各種各樣的管理人才,但不管是管理人才和技術科技人員,創新是最主要的要求。

版權宣告:本文源自 網路, 於,由 楠木軒 整理釋出,共 4923 字。

轉載請註明: 張鈸院士:探索第三代人工智慧,需要勇闖無人區的人才! - 楠木軒