阿里華先勝：遍地開花的AI落地，需要畫龍點睛的威力

2020-05-02由寸建宇發佈於科技

經歷了幾波低潮，人工智能在近幾年迎來了遍地開花。

從圍棋打敗李世石，到魔獸世界贏了頂級戰隊，再到DeepFake以假亂真，人工智能可謂出盡風頭。

但AI在各行各業真實水平到底如何，恐怕只有資深業內人士才能知曉。

4月30日，阿里巴巴的華先勝在由信息技術新工科產學研聯盟主辦的人工智能教育線上公開課中介紹了視覺AI在各行各業中的情況。

他提到，其實當前的AI落地面臨着三個困境，營收困境，實驗與現實的困境，用户需求和成熟技術的困境。由於這三個困境，AI在行業裏產生真正的價值還是非常有挑戰。

他還提到，衡量AI落地是否成功，關鍵看其是否起到了畫龍點睛的作用，即為用户提供了不可替代的價值。

以下是AI科技評論做的演講筆記，提取了關鍵信息與觀點，供大家參考。

AI落地的三個困境

人工智能的產業增速非常快，其中視覺智能佔了百分之七八十，從2000年到2016年，全球共有8000多家的視覺人工智能的公司，2000年到2017年，AI相關公司增加了14倍。

僅在2017年，中國就有100多家AI的公司獲得了5個B類的USD的融資。今天大量的公司都成立了自己的專門的人工智能的機構，學校裏面也出現了人工智能學院。

似乎一切繁榮景象，但實際上真正的AI的落地，AI在行業裏產生真正的價值，還是非常有挑戰。

第一個挑戰是營收，這是從價值的角度來衡量，衡量技術是否真正解決現實問題，是否為客户、用户帶來核心的價值，所以營收指標最關鍵的一條。

實際上AI確實帶來了價值，但是還不足夠，從創業公司的角度來看，也有盈利，但是還沒有達到我們期望的狀態。

還有很多做項目，但項目和產品之間還是有很大的差別，產品可以規模化，但項目很難規模化。也有做API的，但API到底能夠產生多少價值，還不好説，所以事情非常殘酷。

第二個困境在於實驗室和真實世界之間的差別，可以在實驗室把算法測試的非常好，但是拿到真實世界可能表現非常不佳。比如，近幾年比較熱的人臉重識別，左邊是公開測試集的情況，可以看到算法準確率比較高，而在右邊，如果人員的服裝變了，交通工具變了，那麼對算法來説就是非常重大的挑戰。

第三個困境是成熟的技術和用户需求之間的鴻溝非常大，上圖是一個客户提的100多個需求，實際上真正能夠做到的可能只有20~30個。所以，面對用户高期望的需求，我們今天的技術其實還有很多是不成熟。
那麼這也促使我們思考，到底AI技術成功的關鍵因素是什麼？論文很棒？融資很多？還是估值很高？這些當然都是成功的標誌，也是非常重要的因素。

但有一點比上面的都重要，那就是有沒有產生核心價值？有沒有為應用場景、為用户帶來核心的不可替代的價值？這個價值可以是錦上添花，也可以是無中生有。

人工智能最關鍵的一點，是畫龍點睛。區別於畫龍點須，人工智能讓一些事情變得更有價值，更有亮點，能解決過去解決不了的問題，這就是畫龍點睛。

視覺AI的重點行業與技術

除此之外，華先勝還介紹了視覺AI的相關技術，他提到視覺AI的關鍵行業有7個，分別是城市治理、工業生產、媒體娛樂、醫療健康、零售營銷、教育培訓以及視頻通信。

在智慧城市裏面還會有交通、平安、市政、能源、環保等等；工業的場景裏邊有工業的質檢、監控、工藝的優化等等之類；醫療裏面可能還有影像的分析、有導航、有養老的監護、疫情的防控等等。

所以，得益於視覺AI比人類更加高效，各行各業都已經在部署相關平台了。總的來説，涉及到的技術主要大致也包括七個部分：1、視覺理解，通常是計算機視覺相關的；2、編碼傳輸，主要是視頻編碼；3、重建交互，例如三維成像；4、增強和生成，例如合成圖像，合成視頻或者是增強視頻的質量；5、搜索挖掘，這比較偏視覺大數據，能夠把大規模的數據索引起來進行搜索；6、安全評估，比如説一些版權保護、審核等等；7、視頻/視覺平台，我們不管是做研發還是做部署，都要有平台城去支撐大規模的研發和大規模的部署。視覺AI的以上7個技術方向，逐漸支撐起了更廣泛的應用，人臉識別，物體檢測等等技術更是在安防、無人車等領域起着至關重要的作用。

視覺AI支撐的商業落地

華先勝還介紹了基於視覺AI技術的一些案例，主要有基於視覺搜索技術的產品、視覺智造類的產品......
不同於文本搜索引擎，視覺搜索需要描述視覺對象，視覺對象大多數是圖像，其由像素組成。所以第一步是處理像素，這涉及到特徵學習，即用像素把一幅圖變成可以索引的特徵。

第二步是大規模索引技術，主要滿足在很大的圖像視頻數據庫裏搜索想要的東西的需求。

第三步是高精準的搜索，也就是在搜的時候能夠快速的響應返回結果。

主要應用的場景是電商領域，例如淘寶上面的拍立淘，通過拍照就能在電商數據庫中搜索相似商品。

視覺智造和一般的視覺技術不同，傳統的視覺技術是分析、識別、搜索，而視覺智造涉及生成，生成視覺信號，例如阿里巴巴“Alibaba Wood”，能夠1分鐘內可以製作多達200個商品展示短視頻。

例如視頻的修復增強，已經在各大視頻播放平台使用，一些經典的電影經過視覺AI的修復重新煥發了光彩。這也大大節省了人力成本，一個1.5小時的視頻，只要兩三兩三個小時就可以處理完，如果人工的話，則需要40個小時。

還有一個是視頻的植入，修改視頻內容，比如在不影響觀影體驗的情況下，植入廣告牌進去。

視覺診斷也是視覺AI的主要運用方向，例如冠狀動脈的增強影像的分析，原來需要專業的醫生診斷，現在的深度學習方法可以對影像進行準確的分析。另外還有骨科、肺部診斷等等應用。

最後，華先勝總結，人工智能已經進入各行各業，勢不可擋，發展非常迅猛，但也有很多的侷限。數據產生價值，但並不是把幾個東西放在一起炒一炒就能產生價值，最終還是要弄清楚價值是什麼。當前AI落地不僅是人臉識別這些熱門技術，最主要的要傾向於人力所不能及的事情，即讓機器幫助完成人類無法完成的事情。

今天的人工智能方法論，雖然有它不清楚的地方，但在應用領域有很大的空間，需要我們投入大量的人力物力進行研發。

對於傳統產業和數字產業，都要擁抱人工智能，對於人工智能從業者來説，也一定要走進應用場景。對於人工智能的商業化而言，最關鍵的一點就是要創造商業創造不可替代的核心價值，思路可以從錦上添花到畫龍點睛再到雪中送炭最後到無中生有循序漸進。

（雷鋒網）（雷鋒網）（雷鋒網）