7月29日,曠視科技舉辦“始於算法,成於價值”主題年中媒體發佈會,CEO印奇、CTO唐文斌首次合體出席,並正面回應外界的關心和疑問。
一開始印奇便提到,今天我是以一位答題者的身份參加本次活動。作為CV領域名聲在外的明星企業,曠視的一舉一動都備受關注。
去年8月份,曠視衝擊AI第一股赴港上市,引起行業震動,結果在新冠疫情、美國實體清單事件、新基建等多重複雜因素下,曠視的上市之路顯得頗為坎坷。
與此同時,在這個特殊的時代背景下,AI產業發展也迎來了前所未有的機遇與挑戰。今天在本場發佈會上,印奇和唐文斌將首度公開回應上市進程,並分享曠視在2020年的戰略佈局與行業洞察。
上市計劃正在籌備中“對於上市,我們非常有信心”,印奇在發佈會上説到,
“上市是手段不是目的,我們希望通過上市這個公開窗口,向大眾展現曠視的綜合實力,所以上市計劃還在積極籌備中。”
曠視於去年8月25日正式啓動赴港上市計劃,據招股書顯示,曠視估值40億美元,擬公開發行40000萬股,募集資金5至10億美元。
IPO程序僅啓動兩個月,10月初便爆發了美國實體名單事件,包含曠視在內的28家中國科技企業被禁止從美企獲取技術產品和服務。事件一出,曠視上市進程稍有停擺,但並無大礙。
此外,對於公司業務發展,印奇表示,禁止科技企業間的業務往來,對於名單上的中國企業來説,多多少少都會有一定程度上的影響,但曠視擁有自主研發的算法和引擎,在技術產業鏈上相對獨立性,因此,這種影響可以忽略不計。
值得分享的是,新冠疫過後,AI產業落地迎來了更多應用場景。曠視在此也開拓了一些新的業務路線,例如,今年2月初,曠視在10天內自主研發了紅外感知自動測温系統,被廣泛部署於地鐵站、寫字樓等人流密集場所。後來該產品推向海外市場,也收穫了一批海外訂單。
印奇表示,新冠疫情爆發前期,對AI企業產生了明顯衝擊,但疫情後,AI落地呈現出深度擁抱各行各業的態勢。疫情為AI激發了更大的發展邏輯,AI測温只是一個小的開始,未來我們的衣食住行都會越來越被數字化技術所包容。
另外,今年受疫情影響國內大力提倡新基建,着力發展5G基站、大數據、人工智能、工業互聯網等領域,這意味着國內AI技術發展迎來了新機遇,基於此,選擇A股上市也不失為一種好的選擇。
最後印奇表示,
一切選擇還在綜合考量中,如果上市,我們的股票必將是穩定且持續增長的。
在經歷了幾次爆發式增長後,AI產業發展逐漸步入穩定期,或者説是瓶頸期。發佈會上,印奇為我們分享了一組技術成熟度曲線(Gartner),可見當前的AI產業現狀已陷入“死亡之谷”。
這一階段,如何去泡沫化,走出產業發展“深水區”,實現技術落地,是企業關注的焦點問題。作為一家估值40億美元的AI獨角獸企業創始人,印奇分享了他的見解與思考。
AI產業落地要跨越三大挑戰:算法供給、價值閉環和組織人才,印奇説。
算法如同血液,是基礎,是必需品,而當前企業的供給能力還遠遠不夠。AI算法從開發到應用需要經歷可交付和規模化兩個階段。
其中,可交付性遵循二八原則,訓練佔據20%,部署佔據80%。可見,部署是關鍵一環,從目前的規模化生產來看,部署耗費大量的時間成本,卻只能夠解決不到1%的算法供給需求
因此,解決算法供給問題的關鍵在於提高可交付性和規模化生產能力。
技術研發的初衷是服務用户。一個成熟的AI產品,必然要考慮它的用户價值、商業價值和可規模化生產的能力。這是從0到1的過程,也是AI產業落地最艱難的過程。
曠視的眾多AI產品,同樣遵循着這樣的研發邏輯。對此,印奇將其概括為三個階段:
價值驗證:具備技術可行性和用户使用價值。
MVP產品:代指最小可行性產品,觸達行業客户,檢驗商業變現能力。
規模應用:提供軟硬件一體化服務,規模化生產,推向市場。
在他看來,這三個是階段是層級上升,封閉式的價值閉環,同時也是AI產業落地的最大挑戰。
人才的培養是對於任何產業/行業而言都是至關重要的。AI賦能百業,這是一個複雜的系統,需要完整的人才體系結構來支撐。
提到AI企業,大多數人的印象是公司員工基本為技術研發人員,但是對於打造一款面向行業、面向大眾的產品而言,公司配備瞭解行業知識的人才同樣非常重要。
拆開來看,AI產品從研發端到應用端,需要挖掘價值需求、完成技術研發、進行可行性評估,進而推向市場,不同階段需要不同專業程度的人才。但整個過程AI技術和行業知識始終貫穿其中,並且同等重要。
印奇將這一人才需求體系稱為4 in 1結構,凡是一個AI+產業,都需配備CEO(產品經理)、CTO(產品開發)、CAIO(性能評估)、CMO(行業洞察)四種角色。
同時,他強調曠視的人才體系已形成了4:4:2結構,前兩者比重相同,分別為技術和行業人才。
最後,印奇將AI產業落地的三個關鍵總結為:(1)解決算法供給側的問題是AI企業的責任。(2)只有賽道聚焦才能更快完成價值閉環。(3)打造AI人才和行業人才融合發展的新型組織。
聚焦AloT,踐行1+3戰略
始於視覺算法,終於物聯網(AloT),曠視早已不是一家單純的人臉識別算法供應商,而一躍成為物聯網軟硬件一體化解決方案供應商。
在印奇看來,物聯網是人工智能技術應用的主要場景,
如果把人工智能比作「大腦」,物聯網就是「身體」,二者相結合,能夠讓世界更加智能化,我們的願景就是構建連結及賦能百億物聯網設備的人工智能基礎設施。
早在2019年初,曠視就已設下以“物聯網”為核心的3+1戰略佈局。
基於自研的Brain++人工智能生產力平台,深度聚焦個人物聯網、城市物聯網、供應鏈物聯網三大領域,為更多企業提供行業解決方案。
Brain++集算力、算法、數據於一身。其中算法部分來自於深度學習框架天元(MegEngine)。曠視是國內為數不多的自研深度學習框架的企業之一,目前最主流的學習框架要數Google的Tensorflow和Facebook的PyTorch,國內比較知名的是百度的Paddlepaddle和華為的MindSpore。
在此,曠視是唯一一家能夠與國內互聯網巨頭相媲美的AI獨角獸企業。
今年3月份,曠視將天元(MegEngine)框架正式開源,所有從業者都可以免費享受這項技術服務。針對一些外界將天元與Tensorflow、PyTorch等主流框架相比較的聲音,印奇回應稱,
與Tensorflow相比,Brain++是更高維度的東西,比如它更像是Visual Studio,是開發者從一個創意到最後算法交付的端到端產品。目前它還還需要持續的打磨,但Brain++的開源會對行業未來產生積極影響。
此外,本次決定將天元開源是出於多方因素的考慮,為3+1戰略模式擴展更多to B客户也是其中一個。
對於2020年下半年的發展規劃,唐文斌表示,曠視的業務板塊不會再擴張。目前1+3的戰略模式已經具備極高的商業價值,三大場景都是萬億級的市場。接下來, 我們會在技術層面和產品層面,融入一些對行業、對客户價值的新的洞察和思考,把1+3戰略框架做深入做紮實。
此外,印奇透露今年9月份可能會發布Brain++的1.0版本。同時2021年,曠視也會陸續推出更多AI硬件。比如在手機端融入算法、SDK和IP,創建AI定義的智能模塊。在城市領域,用AI重新定義未來的傳感器,或者計算範式。在工業領域,打造更加智能化的工業機器人。印奇表示,
隨着Brain++和三個大場景的推進,軟件和硬件一體化產品會在下半年Q3、Q4湧現。曠視在AI邊緣能力上會有越來越多的AI硬件誕生。
長期來看,曠視1+3的戰略版圖基本不會變,在此基礎上,曠視未來會着力打造一個到二個支柱性產業作為立身之本。從目前的財報數據來看,城市物聯網或許是最重要的場景之一,其在2019年的營收業務佔比超過了七成。
邁向CV+的技術洞察曠視在2019年初,將公司名稱由Face++升級為Megvii,以此對外宣稱曠視不在是單一的人臉識別算法公司,而是走向了更加完整的戰略模式。可能很多朋友會好奇Mgevii的名稱由來,在這裏曠視CTO唐文斌,做了一個小分享。
計算機視覺(Computer Vision)技術,定義為“How computers can gain high-level understanding from digital images or videos”
在這裏,唐文斌將它簡單理解為“大的視覺”,即Meg Vision,那麼,縮寫來看便成了Megvii曠視。
名字由來並不複雜,不過其背後卻有着複雜且完整的技術體系:CV+
以深度學習為支撐的計算機視覺技術如何才能更好地應用?首先要解決的是輸入源的問題,高質量的視頻/圖像作為輸入數據,顯然會有助於視覺技術的處理,其次,處理之後的輸出,能用來做什麼?
基於這樣的技術洞察,唐文斌提出了以計算機視覺核心、包括計算攝影學,以及視覺反饋控制在內的三大模塊,構建了一套完整的CV體系。
計算攝影學:它就像“超級義眼”,通過手機前置攝像頭等傳感系統捕捉肉眼無法感知到的信息。如相機、單反或者攝像頭,它們所攝取的信息分為光、感、知三個系統。
“光”是光學的結構,“感”是光感芯片(CMOS Sensor),“知”即採集一些曝光時長、光譜頻率等信息傳遞給算法。這是傳統的攝取方式,曠視要做的是在其中融入AI技術。唐文斌表示,
目前的攝像系統屬於單向信息傳遞,數據之間無交互,我們將通過AI技術打通數據之間的鏈接,重構光感知系統。
視覺反饋控制:基於視覺認知,調動“眼、腦、手、腿”等全套設備協同運動。如“眼之所見,手之所向”,“腦之所念,手之所動”,在複雜世界中,像人類活動一樣,通過視覺判斷,完成手、腦一套設備的協調運作。
在供應鏈場景中,曠視發佈的操作系統“河圖”,便是這一功能模塊的充分體現。
計算機視覺:它以深度學習為核心,具體從算法、系統和數據三個維度來講,曠視做了很多研發和創新。
算法訓練就是深度神經網絡,在這方面做得最好的就是OpenAI研發的GPT3,它能通過預訓練,與下游任務建立聯繫,無需微調達到SOTA,是目前NLP領域的最優算法模型。對於神經網絡的結構性創新,也是曠視一直在嘗試和探索的事情,比如,
成立基礎模型組,不做應用研究。最後提出的ShuffleNet、ShuffleNet,實現了低算力下的高訓練效率。
將芯片的二進制用於深度神經網絡訓練,探索極高的性能功耗比。其推出的DorefaNet通過低比特神經網絡,實現了性能功耗的明顯提升。
利用幾千張GPU訓練超大“祖母模型”,讓算法模型更加規模化。
研發具有自我演化能力的模型(無需監督和標註)
除了基於算法的結構性探索,曠視在系統層面,打造天元MegEngine與Brain++相結合的完整系統,通過工程化創新提升效率。在數據層面,與北京智源研究院共同發佈“Objects365”數據集,據瞭解,它比COO物體檢測的數據集還要大16倍。
我們通過該數據集與超大“祖母模型”相結合,嘗試探索深度學習的邊界,唐文斌表示。
同時,他也強調,基於深度學習的計算機視覺在物體關聯度、感知維度和感知精度方面都仍有很大的提升空間。這其中的關鍵,在於視覺算法的規模化程度,而目前已知的探索極限,將是全面的、城市級的數字孿生。
對話雙子星,曠視的回應提到創辦曠視科技,還有一個有意思的小故事。印奇和唐文斌思同在微軟實習,某一天他們突發奇想在Iphone4手機上製作了一款小遊戲,沒想到的是,這款小遊戲竟意外的在App store上火了(中國區排第三),更沒想到的是,為此還吸引來了一批投資人。於是,曠視就在這樣的契機下開始了…
啓明創投的創始人鄺子平也是曠視的早起投資者之一,他説,以前覺得他們是一羣很酷的年輕人在做一件很酷的事,時隔9年之後,感覺依然如此。
今日,為了能夠更深入的瞭解曠視,瞭解曠視的創始人,鄺子平與印奇和唐文斌開啓了一場深入又輕鬆的對話,下面小編將部分內容分享給大家~
問題一:印奇和文斌同為技術出身,在創辦曠視的企業管理中,是如何確定分工的?
答:(印)如外界所説,曠視是一家命格清奇的公司,我們的創始人組合並不是最優組合,曠視走到今天背後也有很多偶然契機。我更偏向全局性和戰略思考,解決“what”的問題,文斌更側重技術和產品,擅長解決“How”的問題。但內部實際工作中,並沒有嚴格的劃分,很多問題我們都是一起商討和學習的。
(唐)我認為我們都很聰明,但聰明的點不太一樣。同樣一個新技術,印奇更擅長Deep learn深入思考,而我更擅長Quick learn快速掌握。這一點我們相互補充,並負責不同屬性的的工作。
另外,對於產品問題,我分享一個與第三位創始人楊沐的思考所得。對於產品的定義?他認為是價值的設計者,我覺得非常好,但從AI產品的角度來講,我認為產品既需要滿足客户價值,同樣還要滿足商業價值,雙重價值導向才能設計出一款真正好的AI產品,因此它是雙向價值設計者。
問題二:諸如如小區門禁等,視覺技術越來越普及化,很多AI企業都可以實現。曠視作為行業領導者,它技術壁壘是什麼?
答:(唐)它類似於90分和100分的區別,隨着技術發展拿下90分可能已經不是什麼難事,但要想拿到100分卻並不容易。曠視的標準就是100分。
可能有的朋友會問,真的有必要達到100分嗎?進入小區、公司能夠達到90分已經夠用了但視覺技術的應用場景十分豐富,很多行業/場景要求能夠達到一個金融級別的安全性。越是需要高精尖技術的場景,價值往往也越大,自動駕駛就是一個很好的例子。
問題三:李開復關認為,“如今,AI壁壘低於行業壁壘,AI從業者學習行業難度要遠高於行業者學會AI”,您怎麼看?
答:(唐)我認為不一定。行業知識需要的是經驗,它需要時間的積累,我最近在學習房屋地面沉降方面的知識,對此深有體會。反過來講,行業裏的人去學AI技術,之前從未接觸未必能對它形成深刻的認識。技術本身是童子功,與行業知識相比哪個更容易?還真不一定。
我們在招聘行業人才時,有一個基本要求就是對技術要有信心、有好奇心,有空杯心態。現實中,很多行業裏的人要麼不相信技術,要麼對技術抱有不切實際的幻想,我們二者最好可以能夠綜合一下,畢竟一個好的AI產品最終還是要回歸到交易平衡中去。
問題四:隨着AI落地深水區,曠視的友商越來越多,包括AI企業、互聯網巨頭、傳統科技巨頭等,請問曠視在技術層面,產業方面有哪些優勢?
答:(唐)對於優勢的定義是人無我有,人有我優,我認為這個世界上沒有什麼人無我有,行業裏大家都很聰明,只是有人先看到了一些東西。比如,計算機攝影寫、比如Brain++,我們先看到,並且踏踏實實地去做了,最終我們成為了這個領域內的優勢者。
(印)另外,對於企業競爭問題,首先行業比較碎片化,to B競爭沒有to C那麼激烈,另外,曠視三大賽道的友商,可能與大家想象的友商越來越不一樣。我們通常在深入某個行業後,才發現這個行業裏非常優秀的玩家,它可能偏傳統,但並不是大家眼中的AI企業。
另外,我們可以看到眾多AI公司的風格變得越來越不一樣,這很正常,是一種很良性的狀態。這是每家公司有自己拿手絕活,他們選的行業不一樣,對行業的認知也不一樣。對於曠視而言,我們自己內部講要道路自信,我們很堅定地朝這條路走,越走越覺得這是一種更務實的打法。
問題五:印奇總談到,AI商業化路徑分為三個階段:價值驗證(檢驗技術可行性、驗證產品)、MVP產品(觸達用户,完成變現)、規模化生產(軟件一體化,推向市場),請問曠視在正處於哪一個階段,三個階段最難的是哪一個,是否有出現過失敗,或者走不下去的情況?
答:(印)首先,曠視聚焦的三大場景(個人、城市、供應鏈)涉及不同的領域和行業,不同行業不同的發展階段,所以很難一概而論。
其次,我認為第一個和第三個階段最難。第一階段是完全由創新驅動的過程。一個商人在開拓新業務時,會考慮兩方面:一是技術場景,二是商業模式,兩者之中必然會有一個是確定的。比如,技術場景是確定,那麼可以從商業模式和銷售通路上創新,這條路商業化路徑也可能走得通。但對於AI產品而言,這兩個方面都是不確定性的,要想在兩者之間發現交集點,這個難度要佔整個鏈路的50%。
第三個階段要求AI公司必須構建出非常強的軟+硬平台化能力。硬件能力是平台化,硬件從供應鏈到生產製造到銷售需要平台,搭建完之後“軟”會變得越來越容易。真正解決第一階段核心的公司,如果很快構建第二和三步的話,可能會在行業裏勝出。
(唐)第三個小問題我來分享一個案例。之前為了增強手機的交互體驗,我們做過一款小鳥遊戲,用不同的姿勢隔空打小鳥,後來這個產品被斃了。我們做一款產品會考慮它的價值增效(Value Add),具體來講,它是否達到了降本增效,或者提升了用户體驗。這款產品聽起來比較新奇,但它只是一時的刺激感,成就感和激勵才是持續性的東西,所以我們放棄了。
還有一些產品還未發佈,是因為目前的技術水平不能達到最佳的降本增效或者用户體驗的效果,只要未體現出真正的產品價值,我們就不會公佈。
(印)補充:關於產品這個問題,我發現對於技術性或to B業務的公司,節奏感非常重要。比如,曠視早年研發了一款產品,發現不work(起效),但三年後,這款產品在市場上很有Value(價值),自動駕駛就是一個很好的例子。技術性公司產品研發週期長,它節奏是按年來衡量的,如何早個5年、20年,公司發展就很困難了,所以方向很重要,節奏也很重要。
雷鋒網小結曠視成立9年,收穫了很多標籤,融資快、估值高,CV四小龍,AI獨角獸。在這些榮譽背後,可能離不開的是貫穿其中的企業基因:技術信仰、價值務實。
印奇曾用Moonshot來形容他和唐文斌的技術信仰,一幫很聰明的人,做着從沒做過的事兒,經過N多年努力,經歷了很多的困苦,最後一刻發現把很多東西只往前推了一小步。
如果説技術信仰是一種自我推動力,那麼價值務實則體現了曠視,對市場、對用户負責的態度。印奇在會上表示,價值務實是我們的流淌在血液中的基因,能夠為用户帶來真價值,是每一款AI產品的初衷和目標。
對於未來5年,10年,曠視會成為一傢什麼樣的公司,印奇表示,曠視不會成為一家特別平台化的公司,我們會基於1+3戰略,打造幾個支柱型產業,作為立身之本。此外,在不同場景和維度中構建不同的“腦”,比如在供應鏈場景中,Brain++作為大腦,河圖作為中腦,未來會在每個設備中開發小腦,打造一套完整的智能化體系為行業賦能。
(雷鋒網雷鋒昂雷鋒網)