幸運而又不幸,筆者從事人工智能研究時,正是此領域最低潮的那幾年,當時大家看我們的眼神,像是看一羣 AV男演員——費力不討好。今天的人工智能不僅鳥槍換炮,還在嚴肅地討論統治全人類的問題。學術界和工業界諸仁波切們認為人工智能要接管世界,攏共分三步:第一步,是感知智能;第二步,是認知智能;而第三步,也是決定性的一步,是通用智能。就是關於這第三步,我有話要説。
先討論一下,機器與智能的未來方向到底是為了替代人類,還是幫助人類。我個人的觀點,一半是海水,一半是火焰,這兩個方向是並存的。
宏觀上來看,機器替代人類不但不是科幻,而且早就進展多年了。替代人類,不是説機器拿起彈弓,把人類一個個都崩了,而是説工業革命以來機器生產效率的提升,已經使得人類的出生率自適應地下降了很多——沒辦法,沒那麼多事兒可幹了啊。這個趨勢還將繼續發展,人類作為一個羣體在數量上的萎縮是不可逆轉的。
微觀上來看,機器則實實在在地幫助着人類,你開的車、用的手機,都在幫助人類朝着好吃懶做的共產主義終極理想前進。在“更快、更高、更強”這類物理能力上,機器早已甩開人類幾個數量級了。所以每次奧運會的時候我都納悶:為啥大家還在為飽餐各種興奮劑的偽人類的新紀錄而激動呢?這還不如去工地上看吊車舉重更加有趣。
先聲明一下,我不是人奸(康熙字典解釋:機器人帶路黨,人類的叛徒),所以也希望機器幫助而不是幹掉人。人工智能的發展,就是希望機器在“更聰明”這個點上也能超過人類、幫助人類。從這個點出發點來看,人工智能要跨過幾個大的關隘。
從五十年前人工智能學科誕生起,研究者們就希望機器能夠替代人的五官,像人一樣去聽去看,這就是感知智能。機器像人耳一樣把音波變成音素,就是語音識別任務;機器像眼睛一樣辨識圖像中的物體,就是計算機視覺任務。當然,感知智能不一定是簡單地模仿人,在某些人類束手無策的問題上,比方説指紋識別和虹膜識別,機器輕鬆就能彎道超車。
深度學習技術成熟之前,感知智能裏只有人臉檢測、虹膜識別等一些局部的小問題,解決得比較徹底。更多的泛場景問題,特別是語音識別、計算機視覺等,始終停留在實驗室的研究階段。直到本世紀,深度學習技術的突破,使得機器能夠用複雜的模型從海量的數據裏充分攫取信息。這與小孩子看一次狗就能認識狗,從原理上大不相同。
關於“人類看一次狗就能認出狗”這一觀點,有人是不服的,他們對我説:“小孩子與狗的那一回眸,已經從各個角度採了無數採樣,積累了很多的樣本。”這並不符合事實:我特意觀察過我的兩個孩子,他們在圖畫書上以平面方式見過一次的動物,到了動物園還是輕鬆就認出來了。所以啊,不要以為機器智能的進化是把人類走出非洲的大片兒回放一遍,他們走的根本就是不同的路,而且是我們無法預測的路。
感知智能解決了,機器就具備了節肢動物門的一般能力。想起某公司聲稱自己的人工智能已經達到了幾歲兒童的水平,再看看相關的研究內容,我認為還是説達到更年期蟑螂的水準更加公允。你見過哪個智力測驗是以海量找狗為任務的啊?
感知智能只是實現了一些動物本能,為了象一名真正的靈長目戰士那樣去戰鬥,機器就要完成一些簡單的智力勞動,比如自然語言理解、翻譯、對話等。這類問題,就是認知智能問題。
認知智能要解決的是讓機器掌握初級理解和思考的能力。其中的挑戰比感知智能要大得多了,主要原因就是語言、知識等理解過程中需要建模的對象,複雜程度或狀態空間的規模非常龐大,你算算,中文的音素就 46 個,而常用詞恐怕也有幾千個,建模複雜度不在一個數量級上。
具備了感知和認知智能的機器,基本上就達到了高級靈長目動物的水準,當然在記憶和計算能力上則早已秒殺人類。回到文章開頭的問題,下一個階段就可以追求“通用智能”,接管全人類智力活動了麼?所謂通用智能,就是説同一個人工智能體不僅能下棋或翻譯,而是個無不知百行通的多面手。以目前人工智能的階段直接追求通用智能,好比剛小學畢業就填寫院士評選的報名表,志向雖然可嘉,步子則跨的有點兒大了,總要找出更加具體的路徑才是。
我的觀點是,在通用智能之前,先要解決“決策智能”這類問題。什麼是決策智能呢?大家可以想象每部評書裏都離不開的角色——軍師。與大量僅僅具備感知智能的赳赳武夫和少量具備了認知智能的文書、中軍是不同,軍師的 Job Description,往往是這樣的:
熟練掌握琴棋書畫等一項以上奇技淫巧。
善聽人言,能聞獸語。
進士以上學歷,有三年以上算命或其他相關行騙經驗。
有極腹黑的心理素質,和泰山壓頂腰不直的抗辱罵能力。
能設計和推進公司內犬牙交錯、互相制衡的人事制度。
全面掌握對外與天鬥、與地鬥、與人斗的工作,精通瞞天過海、借刀殺人、走為上等多項計謀的制定和實施。
機器如果達到了這些要求,就可以順利入職成為軍師,主持“草船借箭”、“智取生辰綱”這樣的 Project 了。逐一審視這些要求,我們發現具備了感知智能和認知智能,1、2、3 都不是問題;4 更是機器的天然優勢;而 5、6 兩條,就不那麼簡單了。愚見認為,這才是人工智能未來最需要向人類伸出援手之處,姑且稱其為決策智能——畢竟用機器做速記或翻譯,不過是效率的提高,更加會加速人類的滅亡。區別於機器蟑螂和智能猿猴,決策智能有哪些不一樣挑戰呢?
一、博弈性的場景。當你的環境本身受到你的決策影響時,這就是一個博弈性的問題。往小了説是打牌、下棋,往大了説是戰爭、談判等,僅僅靠靜態的建模方法是無法處理這些博弈性問題的。博弈問題裏,又以像德州撲克這類不完全信息博弈,更為複雜。
二、非明確的反饋。這裏面有兩種場景:一種是很多次決策才能對應一次明確的結果,比方説炸金花,十幾輪的出牌以後才有一個確定的輸贏;另一種是結果本身就是概率性的,比方説廣告的決策,即使是確定了同一個用户,同一個素材,同一個場景,用户點擊還是不點擊仍然是隨機的,只能從概率意義上判斷準確性。
熟悉機器學習的朋友可以打坐思考一番,在上面兩個條件下,解決建模的問題實在不是簡單的事。決策智能有個典型的問題,就是圍棋(圍棋龐大的決策空間使得其解決方案與肉搏式蠻力搜索的國際象棋是完全不同的,而後者其實不太需要智能,基本只需要計算)。雖然 AlphaGo 戰勝李世石的只是達到了一個小小的目標,其過程卻相當令人興奮(汗,似乎暴露了我人奸的本質):這次比賽中採用的 Deep Reinforcement Learning 這一框架,確實似乎讓我們看到了探索決策智能問題的曙光。
下棋雖然本身沒什麼卵用,實用的決策智能問題其實比比皆是。例如,互聯網商業化中常見的廣告決策問題,就同時具有上面的兩個特點,而實際上機器在此應用中已經遠遠超過了人,而且還有巨大的發展潛力。再比如,反羊毛黨、非人類流量過濾這類讓人撓頭的反作弊問題,也都有巨大的商業價值,但決不是簡單的感知智能和認知智能問題。
有人的地方就有江湖。只要人與人之間發生交互,就有決策智能的用武之地。互聯網的大發展,為我們帶來了大量鮮活的這類問題。目前的深度學習框架,在解決這類問題上效果並沒有十分突出,這裏面有些深層次的原因,篇幅所限就不展開了,以後有機會專門寫文章説説我的觀點。
當然,我是站着説話時不腰疼的,趁着腰還不疼,我要懇請人工智能界諸仁波切們在接管全人類之前賞下眼神來,認真思考下在博弈場景和非明確反饋情形下的決策智能問題該用什麼新框架解決,因為這太有意義了,也太有意思了。