經歷了幾波低潮,人工智慧在近幾年迎來了遍地開花。
從圍棋打敗李世石,到魔獸世界贏了頂級戰隊,再到DeepFake以假亂真,人工智慧可謂出盡風頭。
但AI在各行各業真實水平到底如何,恐怕只有資深業內人士才能知曉。
4月30日,阿里巴巴的華先勝在由資訊科技新工科產學研聯盟主辦的人工智慧教育線上公開課中介紹了視覺AI在各行各業中的情況。
他提到,其實當前的AI落地面臨著三個困境,營收困境,實驗與現實的困境,使用者需求和成熟技術的困境。由於這三個困境,AI在行業裡產生真正的價值還是非常有挑戰。
他還提到,衡量AI落地是否成功,關鍵看其是否起到了畫龍點睛的作用,即為使用者提供了不可替代的價值。
以下是AI科技評論做的演講筆記,提取了關鍵資訊與觀點,供大家參考。
AI落地的三個困境
人工智慧的產業增速非常快,其中視覺智慧佔了百分之七八十,從2000年到2016年,全球共有8000多家的視覺人工智慧的公司,2000年到2017年,AI相關公司增加了14倍。
僅在2017年,中國就有100多家AI的公司獲得了5個B類的USD的融資。今天大量的公司都成立了自己的專門的人工智慧的機構,學校裡面也出現了人工智慧學院。
似乎一切繁榮景象,但實際上真正的AI的落地,AI在行業裡產生真正的價值,還是非常有挑戰。
第一個挑戰是營收,這是從價值的角度來衡量,衡量技術是否真正解決現實問題,是否為客戶、使用者帶來核心的價值,所以營收指標最關鍵的一條。
實際上AI確實帶來了價值,但是還不足夠,從創業公司的角度來看,也有盈利,但是還沒有達到我們期望的狀態。
還有很多做專案,但專案和產品之間還是有很大的差別,產品可以規模化,但專案很難規模化。也有做API的,但API到底能夠產生多少價值,還不好說,所以事情非常殘酷。
第二個困境在於實驗室和真實世界之間的差別,可以在實驗室把演算法測試的非常好,但是拿到真實世界可能表現非常不佳。比如,近幾年比較熱的人臉重識別,左邊是公開測試集的情況,可以看到演算法準確率比較高,而在右邊,如果人員的服裝變了,交通工具變了,那麼對演算法來說就是非常重大的挑戰。
第三個困境是成熟的技術和使用者需求之間的鴻溝非常大,上圖是一個客戶提的100多個需求,實際上真正能夠做到的可能只有20~30個。所以,面對使用者高期望的需求,我們今天的技術其實還有很多是不成熟。
那麼這也促使我們思考,到底AI技術成功的關鍵因素是什麼?論文很棒?融資很多?還是估值很高?這些當然都是成功的標誌,也是非常重要的因素。
但有一點比上面的都重要,那就是有沒有產生核心價值?有沒有為應用場景、為使用者帶來核心的不可替代的價值?這個價值可以是錦上添花,也可以是無中生有。
人工智慧最關鍵的一點,是畫龍點睛。區別於畫龍點須,人工智慧讓一些事情變得更有價值,更有亮點,能解決過去解決不了的問題,這就是畫龍點睛。
視覺AI的重點行業與技術除此之外,華先勝還介紹了視覺AI的相關技術,他提到視覺AI的關鍵行業有7個,分別是城市治理、工業生產、媒體娛樂、醫療健康、零售營銷、教育培訓以及影片通訊。
在智慧城市裡面還會有交通、平安、市政、能源、環保等等;工業的場景裡邊有工業的質檢、監控、工藝的最佳化等等之類;醫療裡面可能還有影像的分析、有導航、有養老的監護、疫情的防控等等。
所以,得益於視覺AI比人類更加高效,各行各業都已經在部署相關平臺了。總的來說,涉及到的技術主要大致也包括七個部分:1、視覺理解,通常是計算機視覺相關的;2、編碼傳輸,主要是影片編碼;3、重建互動,例如三維成像;4、增強和生成,例如合成影象,合成影片或者是增強影片的質量;5、搜尋挖掘,這比較偏視覺大資料,能夠把大規模的資料索引起來進行搜尋;6、安全評估,比如說一些版權保護、稽核等等;7、影片/視覺平臺,我們不管是做研發還是做部署,都要有平臺城去支撐大規模的研發和大規模的部署。視覺AI的以上7個技術方向,逐漸支撐起了更廣泛的應用,人臉識別,物體檢測等等技術更是在安防、無人車等領域起著至關重要的作用。
視覺AI支撐的商業落地華先勝還介紹了基於視覺AI技術的一些案例,主要有基於視覺搜尋技術的產品、視覺智造類的產品......
不同於文字搜尋引擎,視覺搜尋需要描述視覺物件,視覺物件大多數是影象,其由畫素組成。所以第一步是處理畫素,這涉及到特徵學習,即用畫素把一幅圖變成可以索引的特徵。
第二步是大規模索引技術,主要滿足在很大的影象影片資料庫裡搜尋想要的東西的需求。
第三步是高精準的搜尋,也就是在搜的時候能夠快速的響應返回結果。
主要應用的場景是電商領域,例如淘寶上面的拍立淘,透過拍照就能在電商資料庫中搜索相似商品。
視覺智造和一般的視覺技術不同,傳統的視覺技術是分析、識別、搜尋,而視覺智造涉及生成,生成視覺訊號,例如阿里巴巴“Alibaba Wood”,能夠1分鐘內可以製作多達200個商品展示短影片。
例如影片的修復增強,已經在各大影片播放平臺使用,一些經典的電影經過視覺AI的修復重新煥發了光彩。這也大大節省了人力成本,一個1.5小時的影片,只要兩三兩三個小時就可以處理完,如果人工的話,則需要40個小時。
還有一個是影片的植入,修改影片內容,比如在不影響觀影體驗的情況下,植入廣告牌進去。
視覺診斷也是視覺AI的主要運用方向,例如冠狀動脈的增強影像的分析,原來需要專業的醫生診斷,現在的深度學習方法可以對影像進行準確的分析。另外還有骨科、肺部診斷等等應用。
最後,華先勝總結,人工智慧已經進入各行各業,勢不可擋,發展非常迅猛,但也有很多的侷限。資料產生價值,但並不是把幾個東西放在一起炒一炒就能產生價值,最終還是要弄清楚價值是什麼。當前AI落地不僅是人臉識別這些熱門技術,最主要的要傾向於人力所不能及的事情,即讓機器幫助完成人類無法完成的事情。
今天的人工智慧方法論,雖然有它不清楚的地方,但在應用領域有很大的空間,需要我們投入大量的人力物力進行研發。
對於傳統產業和數字產業,都要擁抱人工智慧,對於人工智慧從業者來說,也一定要走進應用場景。對於人工智慧的商業化而言,最關鍵的一點就是要創造商業創造不可替代的核心價值,思路可以從錦上添花到畫龍點睛再到雪中送炭最後到無中生有循序漸進。
(雷鋒網)(雷鋒網)(雷鋒網)