AI進化必須修復“注意力Bug”

　　在未經充分訓練的情況下,讓AI關注人是容易的,但關注某個特定的人是困難的。

　　在美劇《西部世界》中,AI主人公覺醒,並意識到這個世界是人類殺伐決斷的樂園,於是開啓了反抗之路;電影《黑客帝國》中,AI將人類豢養起來,控制了整個世界……那麼在科幻世界中擁有了意識的AI,在未來生活中能否實現?

　　日前,在2020年國際學習表徵會議(ICLR)上,圖靈獎得主、蒙特利爾學習算法研究所主任約書亞·本吉奧(Yoshua Bengio)對AI的未來提供了最新見解。他認為未來機器學習完全有可能超越無意識,向全意識邁進。而注意力機制正是實現這一過程的關鍵要素。

　　人類的注意力機制和人工智能的注意力機制是否一樣?現在應用於人工智能的注意力機制還要解決哪些bug,才能讓AI真正具備註意力?就此,科技日報記者採訪了有關專家。

　　目的在於減少對無用線索的關注

　　什麼是注意力機制?“注意力機制來源於人類的視覺注意力,即人類在進化過程中形成的一種處理視覺信息的機制。”中國科學院自動化研究所研究員張兆翔説。

　　張兆翔解釋,人類視覺系統以大約每秒8.96兆比特的速度接收外部視覺信息,雖然人腦的計算能力和存儲能力都非常有限,但卻能有效的從紛繁蕪雜的外部世界中有選擇地處理重要的內容,在這個過程中選擇性視覺注意發揮了重要的作用。如我們在看一個畫面時,會有一處特別顯眼的場景率先吸引我們的注意力,這是因為大腦對這類東西很敏感。

　　視覺注意機制的理論研究自20世紀80年代以來一直是神經科學和認知科學的熱點研究問題,目前研究者們一般按照兩類標準對注意機制進行分類。“從注意產生的方向劃分為:自下而上數據驅動的注意、自上而下任務驅動的注意、兩者結合共同產生的注意;從關注的對象劃分為:基於空間的注意、基於特徵的注意、基於對象的注意。”中國科學院自動化研究所副研究員王威介紹説。

　　“而對於人工智能來説,注意力機制是機器學習中的一種數據處理方法,廣泛應用在自然語言處理、圖像識別及語音識別等各種不同類型的機器學習任務中,其主要功能是減少對無用線索的關注。”福州大學數學與計算機科學學院、福建省新媒體行業技術開發基地副主任柯逍博士説。

　　廈門大學科技處副處長、人工智能系教授紀榮嶸認為,從本質上説,注意力機制是一個特徵信息評估和篩選的過程。

　　一般認為,深度學習中的注意力機制最早是約書亞·本吉奧等人在2014年提出的軟注意力機制。基於約書亞·本吉奧的這套理論後續又發展出了多步注意力機制、跨模態交互注意力以及時下非常火熱的Transformer網絡中的自注意力機制。

　　“目前研究的AI注意力機制各有各的特點,但總的來説就是構建輸入與輸出,或者構建輸入數據在不同層面上的關聯關係,從而達到重點突出部分區域或者數據間的部分關係,提升任務性能。”張兆翔説。

　　未經訓練難以注意新鮮事物

　　最近幾年,注意力機制已被應用到了人工智能的許多細分領域中。“人工智能是可以被設計出不同程度的注意力的。當需要不同程度的注意力時,我們可以設計多個注意力網絡。”柯逍説。

　　據瞭解,從2016年開始,谷歌的翻譯系統就已經使用了注意力機制來提升翻譯質量。在文本問答、對話系統、知識圖譜抽取等自然語言處理任務中,注意力機制基本成為了模型標配。在計算機視覺中,注意力機制的使用也成為了一種趨勢,包括細粒度檢索、圖像分類、行人重識別等在內的多個研究任務中都有使用注意力機制的視覺模型。

　　既然説注意力機制來源於人類的視覺注意力,那麼人類的注意力機制和人工智能的注意力機制是否一樣?

　　柯逍認為,人工智能的注意力在一定程度上是人類視覺注意力機制的仿生,在功能上兩者是近似的,但實際上有很大的不同。

　　“從過程上來看是非常相似的,都是在給定任務(查詢)內容時,幫助人(或模型)去關注最相關的數據信息。” 紀榮嶸舉例説,如在被問及“桌子上有什麼東西?”的時候,人類就會聚焦到桌子的區域。同樣,在視覺問答任務中,人工智能模型也會聚焦到包含有桌子的視覺區域,然後回答“有什麼”。

　　紀榮嶸指出,從原理來説,人工智能的注意力機制主要是通過計算查詢信息與給定特徵的語義關聯程度,來獲得模型的注意力分佈,而人類的認知系統則可能會更加複雜。

　　“人工智能運用注意力的過程實際上是一個記憶查詢的過程,它很快很精確,但無法發現異常。”柯逍舉例説,如讓AI的注意力多次從同一張圖片上獲取關注區域信息,結果永遠是一樣的;但如果讓人類來做這個事,人類看第一次的時候會關注自己感興趣的區域,但隨着觀察圖片次數增加,人類可能會關注這張圖片的其他區域。

　　柯逍指出,此外人類的注意力很容易就可以做到去關注某個特定的事物,比如人羣中的某個人,但是AI注意力沒辦法在未經充分訓練的情況下做這件事,讓AI關注人是容易的,但關注某個特定的人是困難的。另外還有一點最大的差別是人類注意力會關注從未見過的新鮮事,而AI注意力機制不會。

　　與人類注意力相比差距明顯

　　據瞭解,認知神經科學對意識的定義是“對一個人內在思想的感知,或者是對外部事物或內在事物的察覺”。意識形成的過程是一個信息不斷篩選、處理以及演化的過程。

　　“約書亞·本吉奧在2017年的時候曾嘗試用機器學習的方法來證明這個理論,其中一個關鍵環節就是使用注意力機制去選擇‘意識狀態’。所以,從信息提煉的角度來説,注意力機制對形成機器意識是非常重要的。”紀榮嶸説。

　　類比人類思維,AI注意力機制靠直覺還是靠推理?

　　“目前來説,人工智能的注意力機制更接近直覺。”柯逍説,大部分注意力機制,是在訓練過程中重複告訴AI應該注意哪些地方,哪些東西是有關聯的。如在訓練AI的時候,不斷讓AI學習關注貓在河邊吃魚的區域,AI再看到有貓特徵和魚特徵的圖片時,就會關注貓和魚區域,而不會看到貓,看到河推理出可能有魚,然後再去找魚,再關注魚的區域。

　　“近期的注意力模型研究也有傾向於對推理能力的提升。”紀榮嶸舉例説,如近年熱門的Transformer模型就利用了多層的注意力網絡來不斷提煉和處理輸入的信息。在這一過程中,每一層的注意力結果都是在變化,從某種程度來説,可以認為模型是在推理。

　　現在應用於人工智能的注意力機制還要解決哪些問題,才能讓AI真正具備註意力?

　　“首先需要增加模型的知識儲備。當模型有充足的知識後,才知道哪些信息需要去關注,例如,模型如果沒見過飛機的話,就不能很好地執行關於飛機描述的查詢。”紀榮嶸説,另外還需要對注意力模型的結構進行改進,提升模型的推理能力,這樣模型才能夠在複雜的語境下運用注意力完成複雜操作。

　　柯逍認為,就目前來説,AI注意力和真正的人類注意力距離仍然很遙遠。謝開飛通訊員許曉鳳王憶希

更多資訊或合作歡迎關注中國經濟網官方微信（名稱：中國經濟網，id：ourcecn）