的盧深視戶磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峰會

                       

的盧深視戶磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峰會

2020年9月5日,由雷鋒網 & AI 掘金志主辦的第三屆中國人工智慧安防峰會,在杭州正式召開。

本屆峰會以「洗牌結束,格局重構」為主題,會上代表未來新十年的15家企業,為現場1000餘位聽眾和線上幾十萬觀眾,分享迎接安防新十年的經營理念與技術應用方法論。

在下午場的演講環節上,的盧深視CEO戶磊為峰會帶來了精彩的演講。

戶磊提到,大庫時代,金融、交通、應急管理等眾多場景亟需千萬級精準人臉識別技術方案。目前行業內現有方案為多引擎,多層級,分庫管理模式,具有系統複雜、軟硬體開銷大、成本高、效率低等諸多不足。

理想的大庫識別方案應該具備以下幾點:千萬級別底庫,萬億分之一誤識別率,魯棒性好,高度相容性,以及價格適宜。的盧深視是全國首個實現省級規模三維人像應用的AI公司。

在系統架構方面,分為三個層次,由前端多維智慧感知系統、千萬大庫雲端中臺和基於大資料的多模態關聯分析與預測後臺組成。

在技術架構方面,自下而上分為核心演算法層、平臺技術層、業務中臺層和應用層。在演算法層,圍繞3D視覺技術的深度感知演算法族、三維重建演算法族和人臉識別演算法族至關重要。在業務中臺層,如何透過資料接入、資料管理、大庫管理和人臉比對演算法等各技術模組的不斷最佳化,從而提升應用效率至關重要。

再者,的盧深視建立三維資料標準及評價打分體系,這是後續確保三維應用效果的基礎,的盧深視結合實際工程應用經驗,提出了資料質量要求及評價標準。

戶磊還總結了的盧深視3D識別的優勢:

準確率高,錯誤率低於萬億分之一,滿足金融支付標準。

魯棒性好,基於深度資訊能夠做到不受光線影響,針對大角度、濃妝、多膚色多人種等識別場景,也能夠準確識別。

安全性高,在活體檢測方面,能夠實現2D平面偽裝攻擊方式100%防禦。

以下是戶磊演講全文,雷鋒網作了不改變原意的整理與編輯:

的盧深視戶磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峰會

的盧深視CEO戶磊

大家好!我是的盧深視的創始人兼CEO戶磊,今天非常感謝各位行業的專家和嘉賓老師們來聽我分享,也特別感謝主辦方雷鋒網,今年在疫情背景下,AI安防特別需要一個這樣的行業交流機會。

一、大庫時代,千萬級刷臉系統落地面臨的挑戰

任何場景的AI落地都需要有需求,千萬級精準人臉識別是有其需求的,尤其是今年新冠疫情,給我們國家和城市包括應急管理體系、常住人口資訊化管理、大交通等在內的領域都帶來了全面的考驗。

其實在這之前已經有相應的趨勢。自改革開放以來,中國從原來的城鄉二元化結構逐步走向全面的城市化,特別是近10年到15年,超級城市不斷湧現。

大家應該能感受到,除了北上廣深以外,原來所謂的二線城市、準二線城市規模逐步增長,千萬級人口的城市不斷出現。

千萬級人口聚集在一個城市,如何管理?如何服務?這是千萬級庫才能解決的問題。

同時,疫情也帶來一個非常重要的課題,之前的城市管理和城市服務更多地是考慮一些特殊人群,比如公安領域,考慮的是刑偵追逃,刑偵追逃可能是一個幾萬到幾十萬的小庫。

疫情之後,每個人都可能是病毒的攜帶者或者潛在傳播者,這時,不止特殊人群,我們需要對所有的人進行疫情管控,服務人口的體量一下變成千萬級甚至億級規模。

同時,隨著生活基礎設施越來越便利,在大交通和大出行體系中,出現了城市千萬級人流量在封閉場景中流動的應用。比如地鐵是一個封閉系統,一個城市每天載客客流量在1200萬到1500萬規模,這也屬於大庫管理體系。

再比如金融支付,對安全性要求很高,同時它的庫也很大,支付寶和微信的刷臉金融支付,後臺使用者數目都是億級規模。

行業會員領域,尤其是一些連鎖店,可能有幾十萬、百萬甚至千萬的會員體系,他們也需要對會員進行精準的身份識別和個性化服務。

這些都是千萬級甚至億級大庫的場景,且都有急切的需求,但是現有方案無法充分滿足需求,主要存在以下幾個問題。

  • 多引擎

公安和安防領域一般採用多引擎的方式,比如一家廠商演算法不夠準,就採用多廠商、多演算法同時進行,透過多重比對提高識別準確率。

這樣帶來一些問題,一是系統重複建設,資源損耗比較大,整體系統造價很高;二是不同廠商之間系統缺乏統一標準,相容性也比較差,整個系統很複雜,維護很困難;三是可能這種方式還不能完全滿足需求,還是要透過人工逐級排查實現進一步的精準識別,推動身份的確認。

  • 多層級

很多地方會採用區級、市級、省級逐級排查的方式,這樣會讓不同層級資訊無法打通,存在資訊孤島,也使得查詢效率低,不具備易用性。

  •  分庫管理

透過特定標準或標籤對庫進行拆分,把大庫變成小庫,然後進行分庫管理和識別,從而提高識別準確率。這也會帶來一些問題,比如統籌管理難度大,而且對於具備多重身份的人,資料會變得冗餘,嚴重影響使用者體驗。

總的來說,現有方案會導致系統複雜、軟硬體開銷大、成本高、效率低。

我們迴歸到問題本身,理想的大庫識別方案應該具備哪些特點?

首先,需要是千萬級別底庫;準確率要達到千萬、萬億分之一的誤識別率;魯棒性要好,快速且安全,有足夠的反攻擊能力;效能要開放,能夠支援多模態資料接入,相容性要好;要經濟實用,方案切實可行且能利舊。

二、標杆案例研讀與標準建庫方案

的盧深視成立於2015年,是最早一批做三維視覺的AI企業,專注三維視覺智慧感知技術,在高精度深度感知成像、三維實時高精度重建、三維跟蹤識別及感知等技術方向上,處於國際領先水平。

當時我們就在想,人臉的三維資訊經過了精準重建之後能用來幹什麼?這些影象資訊裡有豐富的人臉特徵,加上形狀資訊之後,特徵會更豐富,也能支撐更大庫的識別。

所以我們當時就聚焦3D人臉識別這個方向,也非常榮幸,我們承接了一些國家級專案,在某個標杆省份實現了一個省級3D人臉應用,並且在這個基礎之上真正實現了千萬級大庫的精準識別。

這裡介紹的是我們在2015到2016年的一個案例。這是基於的盧深視“哨兵”三維人像多維資料管控通道實現的,透過裝置的部署,協助使用者實現了全國首個省級規模三維人像應用,後期,我們把它切換成不需要帶證件識別的直接刷臉識別安檢方式。

這個裝置本身具備“一次通行、多維採集、關聯碰撞、全面預警”的特性,在實現二維、三維人臉識別的同時還能提供四軌合一的分析,透過集中式管理平臺,還可以實現行動軌跡與綜合研判分析。

這個案例當時為什麼能夠做成?大家一般會想,做3D人臉識別首先要建庫,但是使用者會覺得麻煩,成本就會特別高。如何在使用者能接受情況下幫助使用者把庫建設起來,並且實施好整個系統?

的盧深視戶磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峰會

上圖是我們當時的一個建設思路,的盧當時採用了“邊建邊用、邊用邊建”的創新模式。

從2D人臉到3D人臉都是在拍人臉,只不過前端的感測器不同,相機從2D相機換成了3D相機,其實3D相機本身包含2D資訊,這在2015年、2016年是比較前瞻性的應用,現在隨處可見,高鐵站的人臉識別裝置、酒店前臺的人臉識別終端都在應用。

我們當時主要透過四個步驟:

1. 通行人員透過三維終端如配合式裝置、通道式裝置、抓拍式裝置或原有二維終端裝置時,終端裝置採集通行人員的人臉資訊後實時向三維人像庫查詢。

2. 三維人像庫返回比中的人員身份資訊。

3. 三維人像庫中暫未錄入通行人員的資料,終端裝置向客戶已有的二維人像庫查詢,比對通行。

4. 未在庫人員資料自動錄入到三維人像庫中,通行人員下次通行時即可完成三維比對通行。

它主要是透過對身份證資訊中的照片和現場拍的影象做人臉識別比對,準確率可以保證,在這樣的前提下,我們把2D攝像頭換成3D攝像頭,就可以同時採集到3D資訊。雖然採集的3D資訊質量不一定很高,但是隻要有足夠的應用頻次,就可以幫助使用者實現一個高質量的3D資料庫建設,而不需要特地去建一個3D人臉資料庫。這是我們的建設流程。

只要思路轉換後,就會發現幫助使用者建庫的方式非常多元,可以有很多入口。人臉取號機、人證核驗裝置、手持式的移動終端等,所有需要做認證核驗的終端都可以變成入庫裝置,當這些終端應用到生活的方方面面時,採集的效率和頻次就會足夠高,建設速度就將加快且成本低。

的盧深視戶磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峰會

這是支撐的盧這一套系統的產品矩陣體系。

三、千萬級刷臉系統關鍵技術點剖析

首先從系統架構來講,我們把千萬級大庫的建庫以及比對系統分成三個層次:

  • 前端多維智慧感知系統

核心是的盧深視高性價比3D結構光相機,它深度集成了高效能三維人臉識別演算法,降低了後端的計算開銷,保證演算法準確率的同時大大降低客戶整合成本,形成前端多維智慧感知系統。

  • 千萬大庫雲端中臺

支援千萬三維大庫人臉建庫、清洗和檢索,精度遠超二維的解決方案,同時,的盧與國產晶片做了深度整合,效能超過同等級國外方案,並且可以與智慧前端及邊緣節點協同處理,最最佳化排程系統內計算資源,提高計算資源利用率,降低系統成本。

  • 多模態關聯分析與預測

在前端感知系統和中臺的基礎之上,基於大資料的邏輯推理、時空軌跡關聯分析,將2D/3D人臉、人體、物品、時間、地點以及人體的體貌特徵和形態動作特徵等多維大資料融合,深度挖掘資料之間的關聯性,實現預測預警。

的盧深視戶磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峰會

技術架構分為四個層次,分別是核心演算法層、平臺技術層、業務中臺和應用層。

最底層是核心演算法層,其中最重要的是3D演算法層,基於RGBD全資訊處理,在恢復深度資訊上我們有一整套深度感知的演算法,包括深度對齊、後處理、人臉檢測與跟蹤等等。同時,三維重建演算法族也是一個核心層次,它可以真正把一個三維物體的形狀資訊進行完整恢復,這是一個非常重要的支撐層次。

在這個核心演算法之上,我們有平臺技術層,後端的技術包括通訊計算、協同最佳化等技術。

再往上是業務中臺,進行資料接入、資料管理、資料清洗、資料優選。因為前面建庫過程中,裝置來源非常多元,透過業務中臺的一系列資料處理過程後,才能得到優質的資料,然後融到資料庫中進行資料同步,最終支撐各種各樣的應用。

的盧深視戶磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峰會

這是整個技術架構。

經過大家多年的摸索,2D人臉庫逐漸形成一套標準,但是3D有深度資訊的資料,這些資料如何儲存、有什麼特點、有何技術要求等方面,行業還沒有形成規範。

的盧這些年在這方面不斷探索,建立起一整套資料標準和評價體系。我們希望和行業協同,將它變成一個行業標準。

另外,對於深度識別的裝置,即感測器本身,需要具備怎樣的深度採集能力和精準感知能力?

我們對大庫情形下的識別精度也有一整套測試的方法和標準。市面上通行的相機比較強調絕對精度,但絕對精度對於人臉和人體物體的精細特徵來講,並不是一個非常重要的指標。事實上,相對形狀的相對精度和對於形狀的擬合度是一個比較重要的指標,恢復人臉肌理的特徵也是比較重要的部分。我們有一套深度質量的評價體系,對這些要素進行綜合性的打分,從而形成對前端相機的整體評價。

的盧深視戶磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峰會

3D人臉識別技術演算法與2D人臉識別有所不同,通常來講,2D人臉識別透過攝像頭獲取影象資料資訊後進行人臉檢測,然後進行特徵提取和資訊比對。

而3D的流程比較複雜,前端是符合標準的3D攝像頭,在獲取了影象資料並進行了人臉檢測之後,還需要進行RGBD資料配準與3D資訊重建,把人臉資訊進行完整的三維恢復。同時,在恢復的三維人臉模型上提取三維人臉特徵,最後進行比對。

在後臺應用上,我們一整套後臺應用伺服器,能夠單獨部署,也可以整合部署,並且支撐高併發請求的快速處理和及時響應。

同時,我們針對寒武紀MLU270的體系結構特點改進了深度學習網路結構,設計最佳併發處理模式,提高吞吐率,充分利用硬體平臺算力。在保證精度基本不損失的情況下,突破了三維人臉識別演算法的INT8量化技術。

的盧深視戶磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峰會

另外強調一下多模態架構的理念。物理世界中的物體都是3D的,獲取到完整的3D資訊對於系統精準感知和識別的進一步提升非常重要,換句話說,增加資料維度是最有效提升系統感知能力的方式,可以以此突破深度學習發展的瓶頸。

我們認為,多模態的架構是未來的趨勢,3D也只是這個多模態架構中的一個方向,但它是一個比較易得的方向,因為它不會改變原來2D人臉識別中各種各樣的互動和體驗,同時還能提升整個系統的準確性和完全性。當然,以後我們還會融合更多技術,把這個系統做的更好、更安全、更可靠。

總結一下3D識別的優勢:

  • 準確性高。千萬大庫下錯誤率低於萬億分之一,具有極高的安全性。

  • 魯棒性好。不受光線影響,可以實現7X24無間斷地安全保障,對於大角度、濃妝識別的準確率更高,體驗感也更好,大角度可識別;對不同膚色人種識別率幾乎不受影響。

  • 安全性高。對於活體檢測,可以做到2D平面偽裝攻擊方式100%防禦。

總結一下的盧深視大庫識別方案。精準,可以做到萬億分之一誤識別率;具備千萬級別底庫前提下精準識別的能力;高效,魯棒性好,快速且安全;支援多模態,相容性好;具有切實可行的建設方案,可利舊,價效比高。

四、的盧深視提供“三維全棧”技術支撐

最後對的盧深視做一個簡單介紹。

的盧深視公司基於三維機器視覺和人工智慧技術,提供實體空間人像身份、行為、軌跡的精準感知和整體解決方案。公司團隊是國內極少在深度感知成像、三維重建、三維識別測量定位等全棧式三維技術領域具備國際領先能力的原創團隊。

我們認為3D是一個很大的賽道,這個賽道中的關鍵點不僅在於演算法,還在於硬體感測器,它要面對不同的應用場景。我們常提到的開放場景的空間感測和識別,物體的感測和識別,都是我們的研究方向。

我們總部在北京,在合肥、杭州都有研發中心,深圳是我們的營銷中心,同時我們在很多地方建設了本地化的服務網路,跟很多高校也有深度合作。

我們的技術定位,是以“人”為標的物,構建“光電+演算法”全棧3D機器視覺及其智慧架構。

我用“機器視覺”這個詞呼應一下前面華為機器視覺總裁段愛國講的,我們也認為,以後視覺的發展核心不再是給人看,而是給機器看。3D在這個環節中是非常重要的一個元素。

的盧深視戶磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峰會

因為影象視覺發展多年,都是圍繞讓人眼看著更好去不斷演進的,3D的資料,特別是深度資料,是人眼不太能感知到的資料,或者說人眼對這個資料不太敏感,但是對機器很重要,機器需要這些更豐富、更準確、更相關的資料來更好的完成它的任務。

其實光本身的資訊中還有很多諸如相位、偏振態的資訊,這些都可以進一步提升機器視覺應用的準確性和安全性,從而擴充套件它應用的範圍。

在這個維度中,我們主要是聚焦於人全息特徵的精準識別和分析,在3D人臉方向,我們經驗比較豐富,另外,我們也在研究人的體貌特徵分析技術,以及結合各種各樣的資料實現精準的識別的應用。

從基礎研究路徑看,3D與2D不同,3D感測器非常重要,但目前還處於產業初級階段。演算法、資料、感測和應用,這四個維度交織演進,是我們終極的技術演進路徑。

的盧深視戶磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峰會

最後回到今天的主題,隨著人臉識別在各行各業得到更多使用者的認可,千萬級大庫應用的進一步升級也會成為重要課題。任何一個系統隨著廣泛的應用都受到更多的關注,也會催生更多新的需求,我們堅持回到技術本身,從技術上提升應用能力。雷鋒網雷鋒網雷鋒網

版權宣告:本文源自 網路, 於,由 楠木軒 整理釋出,共 5961 字。

轉載請註明: 的盧深視戶磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峰會 - 楠木軒