楠木軒

專訪吳軍:未來10年,AI的發展方向是應用,不會出現重大的理論突破

由 東方崇學 發佈於 科技

作者 | 蔣寶尚、陳彩嫺

編輯 | 陳彩嫺

我們生逢信息時代,對信息的本質卻知之甚少。
大部分人只知道1965年提出的摩爾定律是信息處理能力的描述,它正在以每 18 個月就加倍的發展速度“顛覆”着我們的生活方式。 
殊不知,信息技術的發展,是由信息的傳輸、處理和存儲技術這三個維度決定的。
而全世界信息技術的發展,都是沿着“用更少的能量傳輸、處理和存儲更多的信息”這條主線來進行。 
為了描述信息發展的規律,吳軍博士在他的新書《信息傳》中,以信息發展史上的傑出人物及事蹟入手,通過故事的方式描述了前人追求上述“主線”所經歷的曲折與多彩。

(吳軍博士新書:《信息傳》)
其過程起承轉合,柳暗花明,蕩氣迴腸,但又順理成章。
所謂起承轉合,始於1901年,一位叫伽利爾摩·馬可尼(Guglielmo Marconi)的27歲意大利年輕人在加拿大紐芬蘭的信號山頂放飛一隻巨大的風箏,接收到來自遙遠英國波爾社基站發出的信號——摩爾斯電碼S,標誌人類進入無線電通信時代。
所謂柳暗花明,是世人追尋電和磁共同本質苦苦不解之際,一位叫詹姆斯·克拉克·麥克斯韋(James Clerk Maxwell)的學者發表《電磁場的動力學理論》一文,用 4 個簡單的公式,即著名的麥克斯韋方程組,描述了電、磁、光相互作用、相互轉化的規律。
所謂蕩氣迴腸,是1937年,一位叫克勞德·香農( Claude Shannon)的22歲麻省理工碩士生跑到美國首都華盛頓進行碩士論文答辯。他的研究成果開啓了數字化時代,他所總結的信息論揭示了信息的本質,給人類帶來了一種新的世界觀。

(克勞德·香農)
順理成章地,在香農信息論的指導下,人類發展信息幾乎從此沒有再犯過致命的方向性錯誤。從1G到5G通信的發展,無非是工程師按照香農第二定律指出的方向,根據各個時代能夠獲得的技術, 對信息編碼和傳輸技術進行持續改進而已。
如今,我們站在科技發展的風口浪尖上,目睹着風起雲湧的社會鉅變。
那麼,《信息傳》是如何理順信息技術的發展歷史,幫助我們進一步瞭解信息的本質,理解信息技術和經濟發展的趨勢的呢?基於這個大問題,AI科技評論對吳軍博士進行了專訪,從回顧過去,描述現在,預測未來三個維度探討了信息技術的發展規律和商業模式。
在專訪中,吳軍博士提到:在信息論出現之前,前人的研究是自發的,他們的成功是偶然的,失敗是必然的;而信息論出現之後,成功不再是“運氣”使然,而開始有跡可循。
特斯拉的失敗,因此得以避免。
此外,吳軍博士還提到,人工智能未來十年的發展方向是AI技術的應用,理論上暫時不會有重大突破。

1

回顧過去:揭示信息理論發展的規律

AI科技評論:為什麼要寫《信息傳》這本關於信息技術發展的書籍?通過這本書,除了告訴我們“歷史”,還想告訴我們什麼?
吳軍能量和信息是衡量我們這個世界文明程度的硬性標準。一種文明能夠創造、使用和傳輸的信息越多,手段越有效,其文明水平就越高。
瞭解信息是什麼,瞭解信息技術是什麼,才能幫助我們在日常工作學習中更好地收集和利用信息。
雖然這本書講述的是信息的歷史,但描寫歷史只是手段,更想呈現的是信息技術發展的規律。
關於規律除了有“用更少的能量傳輸、處理和存儲更多的信息”這條主線脈絡,還可以根據理論效果,將信息發展時間分為“自發的階段”和“自覺的階段”。
所謂自發階段是指,人由本能(例如好奇心與探索欲)驅動所激發出來的發明創造。在自發的階段,技術的發明者有很多隨意變更的因素,因此在這一階段,你會看到偶然的成功往往把人帶偏方向,遠離目標,例如無線電之父特斯拉就不幸進入了這個怪圈。
(尼古拉·特斯拉)
由於自發的階段缺少理論支撐,運氣成分非重要,每一個成功的背後可能存在着非常多的失敗。談到電報,大部分人只知道莫爾斯的成功,而不知道其他人的失敗;談到電話,大家只知道貝爾,而不知道其他人。而實際上,他們的成功其實有很大的偶然性。
自發階段持續了很長時間,直到1948 香農提出信息論,用一個被稱為“熵”的概念和三個非常簡潔的定律,描述了信息科學的本質。才使得我們進入自覺階段。
自覺階段的標誌是:存在正確的理論支撐。所以那之後信息科學和工程的發展, 人類從此幾乎沒有再犯過什麼大的錯誤,也沒有走太多的彎路,從1G到5G移動通信的發展,無非是工程師按照香農第二定律指出的方向,根據各個時代能夠獲得的技術,對信息編碼和傳輸技術進行持續改進而已。
現在很多人仍然堅信“偶然性”,在思考問題的時候,仍然在缺乏理論支撐的詢問“我能否這樣做”,而《信息傳》這本書希望讓讀者知道理論的重要性,也就是説試錯固然重要,但不要盲目試錯。
AI科技評論:無論是在《信息傳》,還是在之前的書中,您都反覆提到專利,專利對技術的發展有什麼重要作用?
吳軍:專利是把雙刃劍,一方面它有激勵作用,另一方面它也限制着技術的普及。
激勵作用在於能夠保證發明人受益,畢竟只有受益,大家才願意投入錢去進行發明創造。尤其在今天,很多研發的成本都很高。例如做一個5G方案,首先就要投入數億元,而且不能保證是否見效。如果投資者賺不了錢,其開發創造的積極性自然就弱化。當然,也有少數人是完全由興趣驅動的,大部分人做事其實還是為了圖利。
另一方面,技術也要普及,所以現在各國的專利都有一個專利期限。美國的專利期最多是20年,20年過後,這項技術就變成了公共領域的知識,讓更多老百姓受惠。
AI科技評論:除了專利這一激勵因素,其實早期技術發展與國家的地理位置也有關係,是這樣嗎?
吳軍:科技發展和地理相關的一個重要原因是:經濟和地理位置的關係特別緊密
例如,南美洲與北美洲的氣候差異,影響了兩個地區的經濟發展:南美洲的氣候條件要比北美洲好很多,所以南美洲可以通過發展種植業來增加經濟收入,另外,南美洲還有許多金礦,因此,這個地區發展工業的動力也不足;而北美洲的氣候條件不如南美洲,但最後北美成了一個特別發達的工業地區。
另一個例子是無線電為什麼要到英國去進行實驗?因為英國是島國,與歐洲其他地區的通信相比,英國的電纜的成本太高,所以需要發展無線通電。同樣道理,無論是馬可尼和特斯拉,為什麼都到美國跟歐洲進行通信研究?因為雖然可以拿電纜進行研究,但拉電纜不但成本高,而且經常失敗,所以後來大家想到無線通信的方式。
 
2

描述現在:信息技術發展的問題

AI科技評論:當前信息技術的快速發展,雖然給我們帶來了許多便利,但是也存在的一些問題:信息太多,導致“泥沙俱下”。目前有沒有一些方式有望幫助我們過濾信息、管理信息?
吳軍:信息太多讓大家廣泛受益的同時,也帶來一個非常嚴重的問題:信息泄露和錯誤信息(謠言)給人們造成的巨大損失。
雖然在古代,也有謠言和信息泄露,但是通常不會帶來巨大的系統性的連鎖反應。在人們開始廣泛地使用現代通信工具大量傳輸信息之後,信息泄露就會給人們帶來雪崩式的毀滅性災難。
所以,需要考慮的是如何甄別有效信息。目前主要有兩個解決方法,一個是交叉驗證,另一個是尋找可靠的信息來源。
舉個最簡單的例子,前段時間關於金正恩有許多假新聞,有些新聞CNN也在報道,其可信度也是非常低,這並不意味着CNN有多糟糕,關鍵是CNN在朝鮮可能沒有記者,大多都是二手信息。其實關於金正恩的信息,一個簡單的判斷標準是:是否有韓國的正式媒體報道,因為韓國非常關心朝鮮的狀況;另一個是日本是否有正式的媒體報道,畢竟日本在北朝鮮有很多僑民。
另外,關於自媒體的信息,一定要看出處。當前有些轉載是夾雜了“私貨”:95%的內容是一樣的,剩下5%的信息是改寫的。雖然只有5%,但有可能產生重大真實性、客觀性轉變。
利用交叉驗證和信息來源檢查這兩個“原理”也催生了相關甄別信息的技術產品,例如我們之前在谷歌開發了一個產品叫做“Google Answer”,就可以利用機器學習對信息進行權威來源檢查。
AI科技評論:不僅是《信息傳》,在《浪潮之巔》也提到過,有些科研想法如果超越時代背景,那麼他有可能失敗。這對現在的科研者有何啓示?
吳軍:首先,科學和技術要先分開。科學的發展常常要領先於技術。一項科學知識的作用,往往要經過幾十年才能驗證。今天的5G用的基本編碼算法,實際上在六十年代就已經有了雛形。3G用的CDMA算法與變頻調製,在二戰時也有了雛形。從科學到技術,再到產品,中間的間隔可能比較長。
所以,國家一定要大力發展科學,因為有時候,科學產生的結果短時間內看不到,但到關鍵時刻,你會發現,沒有科學基礎,後面的技術發展也舉步維艱。如今中美關係比較緊張,大家對技術比較關心,但在缺技術時,大家還應該反思:更早的時候,我們可能應該在科學上多做一些投入。
其次,在同一個時代,科學可能會帶來技術的進步。技術路線有很多種,最後成功的可能就一兩種。一項技術的失敗,對投資人來説影響不算大。比如投了10項技術,兩項成功,八項失敗,成功的兩項技術可能就能把投資的錢“回本”,而且還可能有利潤。但對創業者來説,一項技術的失敗是百分百的"災難"。
在每個時代,解決同一個問題的技術可能有很多,甚至成功的兩項技術也未必是一開始最被看好的技術。成功有很多原因,可能是資金,可能是執行力,等等。所以也不能完全以成功或失敗來衡量一項技術水平的高低。
此外,每項技術都有一個發展階段。這個發展階段很重要。還有些技術可能很有潛力,但在某個時間段裏,大家對這項技術沒有需求。例如存儲技術,之前的磁帶、磁盤等,也只存活了半個世紀。如今,大家可能用網絡存儲或分佈式存儲。如果你是磁存儲技術的領先者,那麼你可能在前十年能憑此獲利,過後就被淘汰了。

3

預見未來:5G與人工智能的發展

AI科技評論:根據信息技術發展的特點,您認為未來信息技術的主要發展方向在哪些應用與領域?
吳軍信息技術的發展基本上是三根主線,即信息的傳輸、存儲和處理
5G是信息的傳輸,人工智能是信息的處理。更具體一些,電報、電話、手機通信和互聯網,都是傳輸信息的手段,計算機和各種控制系統則是處理信息的工具,紙張、膠捲、磁帶、光盤、半導體存儲器,則是存儲信息的媒介。
全世界信息技術的發展,都是沿着用更少的能量傳輸、處理和存儲更多的信息這條主線來進行的。
在移動通信中,從 1G到 5G,單位能耗的信息傳輸率提高了 5 個數量級左右,這就是通信發展的根本趨勢。處理信息也是如此。儘管 1946 年世界上第一台電子計算機埃尼亞克耗電量高達 150 千瓦,但是進行一次計算依然比機械計算機更能節省能量。
如果擴展的話,信息技術是一項在其他國民經濟產業中起疊加作用的技術
一方面,信息技術本身就是一個產業,而且產業規模不算小;另一方面,如果將信息產業與其他產業疊加,比如汽車信息化以後,汽車可以配備地圖、道路識別等,開起來會方便很多;或者,通過可穿戴式的系統與手機,汽車會變成一個移動平台,成為一個生活辦公場所,這時候汽車可能就被重新定義了。
同樣的道理,今年因為疫情,大家可以在家上班。如果疫情發生在20年前,在家上班就很困難,因為20年前,大多數人的家裏沒有完善的IT設備。如今,信息技術發展後,我們的家裏實際上就是一個信息中心,所以能夠在家上班。
因此,信息技術的發展,一方面是基於信息的核心往前發展;另一方面,信息技術的發展還會輻射到許多周邊產業。
AI科技評論:能不能對人工智能的技術發展進行預見?
吳軍人工智能接下來的十年發展方向是技術應用,理論上暫時不會有太多的突破了。計算機技術有一個“規律”,也可以説是共識,就是哪一個發明或者技術獲得了圖靈獎,那麼它在短期內就走到頭了。
人工智能的主要支撐技術深度學習已經在2018年獲得了圖靈獎。另外,今天我們使用的深度學習技術其實都是基於20多年前的工作。科學肯定是領先於技術的。雖然目前麻省理工等科研高校也在做一些理論性的研究,但是如果想要變成技術應用至少也是20年以後的事情了。
也不是説現在沒有進行一些原創性的理論研究,只不過這些研究大多在科研院所和高校裏進行,其理解門檻和進入門檻比較高,在媒體傳播中沒有優勢,只是在學術圈內進行交流。例如學術界對深度學習的可解釋性理論非常關注,都在投入大量的時間、經歷、金錢,如果有突破,那麼將會是重大的理論突破。
AI科技評論:從1G到5G,信息技術的發展對商業的影響有什麼特點?在5G時代,信息商業的發展會體現怎樣的趨勢? 
吳軍:從1G到5G,其實真正影響我們生活的是階段3G~4G。1G的用户量很少,從2G開始,大家能夠彼此的通過手機來通訊的,但也只是限制在通信本身,能夠乾的事情非常少。 
3G到4G在中國的過渡時間非常短,4G這個時代發生的第一個大事就是和雲計算的結合,使得我們能夠隨時隨地的訪問信息。這時候手機成為了獲取信息的平台。
在4G時代,網絡可以分為兩個部分:通信的網絡和計算機的網絡,而這兩個網絡在手機上是融合的。但從產業的角度看,從技術和商業角度來看,這兩個網絡都沒太融合。舉個例子,在家用手機連接WiFi上網是計算機網絡,而在外面用“流量”上網是通信網絡,這兩者並沒有打通。
所以,談到5G,必須和IOT聯繫到一起,必須講萬物互聯,只有將所有網絡融合到一起才能克服4G帶來的缺陷,打通各方“利益”,進入萬物互聯的時代。 
AI科技評論:3G到4G在中國過渡很快,但是5G的建設這中間似乎腳步很慢,這是什麼原因呢?
吳軍:有兩個原因,第一個是所有技術應用都需要配套,例如要想用5G進行萬物互聯,其工業設備和管理軟件都要同步更新。
這件事情,對於個人來説比較簡單,因為如果家庭想要更換5G設備,那麼自己就能做主。而在企業、工業裏,其在4G時代已經投入了大量的成本進行建設,如果更換成5G,企業會付出大量的成本。
第二個原因是,5G網絡建設需要時間,現在雖然個別5G試點網絡情況非常好,體驗非常舒適,但是“個別”帶來的意義不大,因為只有大眾都能感受到,才是真正的5G時代。 中國工程院院士鄔賀銓是我國通訊方面的專家,他自己估計5G網絡建設還需要10年時間,其實10年非常漫長。

雷鋒網雷鋒網雷鋒網