黃飛躍 |
5秒!對著物流單據掃描、資訊錄入,這是整個流程的用時,而且,單據識別準確率超過了98%。在這之前,人工錄入環節需要3分鐘。
作為中國物流行業領軍企業的中外運提出智慧物流轉型方向,這家企業對接世界上不同公司的貨物運輸需求,不少企業服務場景都需要人工重複錄入,成本高、效率低,錄入時間不能靈活處理,但透過騰訊雲,諸多問題迎刃而解。
這背後,為騰訊雲提供計算機視覺AI技術的便是騰訊優圖實驗室。一直以來,作為騰訊消費網際網路業務背後的“隱形AI戰隊”,優圖為包括QQ、微信、騰訊微視等提供技術支援,而隨著騰訊戰略轉型擁抱產業網際網路,優圖以計算機視覺技術為核心,專注人臉、人體、影象等視覺領域的前沿研究和產品落地,加速與實體經濟深度融合,在社會民生領域廣泛應用。
如今,騰訊優圖在技術研究和產業落地“兩條腿”支撐下,透過產業應用實踐對技術進行檢驗,不斷加速產業數字化升級,探索如何讓AI真正惠及社會大眾,為“科技向善”加速。
快跑階段已過▶▷
多年服務C端技術積累,領先優勢持續擴大
疫情之下,小小的口罩,帶來的是安全感。然而,全民佩戴口罩也對諸如高鐵閘機等需要人臉識別的場景提出了挑戰:戴口罩人群由於面部區域大範圍被口罩遮擋,現有演算法無法準確檢測人臉位置、定位五官關鍵點,大大降低現有的人臉識別演算法效果。
即便戴口罩,不同場景千差萬別:誰偷偷摘下了口罩,誰戴錯了,單靠人工排查怎麼減少疏漏?再比如,在高鐵閘機等需要人臉識別的場景,能不能不摘口罩實現人臉識別,降低感染風險?
針對這些難題,優圖迅速成立攻堅小組取得了突破,成功研發出了口罩佩戴識別專用AI。這套AI既能對戴口罩者實現人臉識別,又能發現口罩佩戴錯誤人員,口罩佩戴識別準確率超過99%。
對於社群人員管理和排查,騰訊優圖還能結合人體識別技術(ReID)進行身份確認。人體識別技術不完全依賴人臉識別,而是結合了著裝、體態、髮型等特徵進行辨認。
疫情期間,各大AI廠商紛紛推出各自的識別解決方案,甚至形成了同質化競爭的格局。但在騰訊優圖實驗室總監黃飛躍看來,事實上,企業的差距越來越大。
“不能只看準確率,還要看識別的規模,比如是針對幾千還是幾十萬人的識別,還要識別老人、小孩等不同人群的差異,不同口罩、不同光照下的差異,還有長相相似的人群區分,這部分提升空間越來越難,尤其是針對細分領域,差別依然很大。”黃飛躍說。
在黃飛躍看來,人臉識別已經過了快速奔跑、粗放增長的階段,不同企業的差距不僅僅是技術,還包括生態整合能力,也不只是單一的識別率問題,還包括服務客戶的能力和硬體輸出的能力。
與產業結合▶▷推動企業數字化提質增效
依託前沿技術研究,騰訊優圖視覺AI早已走出實驗室,加速產業數字化升級。
這背後,是騰訊全面擁抱產業網際網路。在2018年9月騰訊組織架構大變革之前,優圖實驗室的工作主要集中在騰訊內部的內容技術中臺的打造上,轉型後則更多地放在了透過騰訊雲等業務為載體的技術對外輸出之中。
針對工業企業,從供應鏈、研發、生產到營銷、服務的全流程問題,騰訊優圖的AI能力正在助力工業行業提升生產效率,降低生產成本,保證科學管理和智慧生產。
對於華星光電來說,面板屬於精密儀器,對產品優良率的要求非常高。但是面板一些細微瑕疵非常微小,不容易被檢測出來。由於缺陷種類多達120種,在不同線路、不同產品上的缺陷特徵又不一樣,一個質檢員從入職到上崗,需要2-3個月的崗前培訓才能勝任。
騰訊雲結合在工業視覺的能力提供相關解決方案,透過AI演算法來學習華星工廠AOI裝置拍攝的缺陷照片,對缺陷進行自動分類,給華星上線了100多個演算法模型,這背後便是來自優圖的影象識別演算法。
“圖片檢測其實挺考眼力的,因為很多圖片看上去都差不多。”華星光電工作人員說,過去,產線上每天產生一兩百萬張圖片,每個人要看1萬多張圖片,對比傳統的人力判片方式,AI識別速度提升5-10倍,縮減人力50%,
華星光電高階副總裁陳盛中也感慨道,“用AI、大資料等進行判別,最終迴歸到了人的價值。實際上,用人來判別圖片,這樣的簡單重複勞動,對個人來說並沒有實現增值,相反,讓人脫身從事大資料分析,將有更大的價值”。
從生產流程向兩端延伸,騰訊優圖進一步將人工智慧覆蓋整個產業鏈,提升管理和運作效率。在國外某知名企業的應用中,透過影象分析和統計,大型工廠車間裡的各種資訊,比如不同工種的工人區域分佈是否最優,貨物的擺放是否合理。這些資訊會有助於管理層判斷當前的業務流程是否合理,是否有最佳化的空間,進而提升工廠的管理和運作效率。
騰訊優圖在為工業企業提供解決方案層面上,具有“人工和自動化相結合”“通用性和定製化相結合”“公有化和私有化相結合”三大策略,推動傳統制造業邁向高質量發展。
發力新基建▶▷助力騰訊打造“底座建設”
自新冠肺炎疫情發生以來,以人工智慧為代表的新興科技,已經從雲端“落地”。與此同時,產業網際網路的快速發展在網路、算力、演算法和安全等方面都提出了更高要求,迫切需要進一步加快以5G、資料中心、人工智慧、物聯網等為核心內容的新型基礎設施建設。
對此,騰訊在持續推動新一代資訊科技與製造業深度融合,助力新基建的底座建設。事實上,作為騰訊頂級的AI實驗室之一,騰訊優圖擁有超過800項全球專利。在零售、金融、工業等領域都有非常深厚的沉澱,經過這兩年的摸爬滾打,為各行各業積累了相當多的案例和經驗。
在與中外運的合作中,除了單據錄入,目前中外運在訂艙委託、訂艙確認件、提單樣本等環節都應用了騰訊雲OCR技術,基於優圖領先的深度學習演算法,將過去大量需要人工操作的業務流程變成全自動化,大大降低企業負擔。
在智慧生活方面,在騰訊與步步高合作的智慧門店中,刷臉識別會員、刷臉支付均依託於優圖人臉識別技術,消費者在2秒內即可完成支付,門店收銀效率提升了兩倍,為步步高節省30%以上的人力成本。
從人工智慧在零售、物流等產業的快速落地中不難看出,AI與產業融合的趨勢愈發明顯,AI將成為各行各業降本提效的關鍵武器,助力行業升級轉型。未來,隨著5G、雲、大資料和人工智慧對產業的深入,優圖也將繼續以技術創新為驅動,為各行各業提供數字轉型、智慧升級、融合創新等服務的基礎設施體系。
■高階訪談
騰訊優圖實驗室總監黃飛躍:
與產業網際網路結合
發揮更大價值
12年前,黃飛躍從清華大學博士畢業,隨即加入騰訊剛成立不到一年的騰訊研究院,帶著5個人的小組,第一個專案是做一款名為“QQ影像”的桌面處理軟體。如今,這個團隊已經擴充套件到數百人的規模,並憑藉已有的技術積累與產品落地能力加速向ToB的產業網際網路邁進。
南方日報:一直以來,騰訊優圖以服務內部為主,而現在逐步向外拓展,這背後是一個怎樣的邏輯?
黃飛躍:從內部到外部,是一個比較順的邏輯。我們先在內部探索,但其實對AI技術來說,外部才是很大一個市場,我們需要尋找更大的價值,而伴隨著騰訊向產業網際網路邁進,優圖的核心技術也開始以業務形態來對外輸出。
南方日報:騰訊之前以服務C端為主,和現在服務B端時有怎樣的不同?
黃飛躍:從C端到B端,技術本質上來說都是相通的,C端需要一種技術運營商的思維,要求對線上客戶有實時的反饋和提高,而B端有較多都是線下場景,場景千差萬別,複雜程度也會更高,同樣是人臉識別技術,到了線下就涉及室內還是室外、白天還是傍晚等,B端對技術和要求會更高一些,客戶可能會更傾向於穩定性,而不是高頻率的創新性。
B端考慮的問題也更多,比如有些客戶對安全要求比較高,還有客戶使用的是低端攝像頭,獲取的資料分辨力差一些,那我們的演算法就要在安全性、便利性等方面找到平衡,使客戶在不同的場合都能用起來。
南方日報記者 郜小平 葉丹