的盧深視户磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峯會

                       

的盧深視户磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峯會

2020年9月5日,由雷鋒網 & AI 掘金志主辦的第三屆中國人工智能安防峯會,在杭州正式召開。

本屆峯會以「洗牌結束,格局重構」為主題,會上代表未來新十年的15家企業,為現場1000餘位聽眾和線上幾十萬觀眾,分享迎接安防新十年的經營理念與技術應用方法論。

在下午場的演講環節上,的盧深視CEO户磊為峯會帶來了精彩的演講。

户磊提到,大庫時代,金融、交通、應急管理等眾多場景亟需千萬級精準人臉識別技術方案。目前行業內現有方案為多引擎,多層級,分庫管理模式,具有系統複雜、軟硬件開銷大、成本高、效率低等諸多不足。

理想的大庫識別方案應該具備以下幾點:千萬級別底庫,萬億分之一誤識別率,魯棒性好,高度兼容性,以及價格適宜。的盧深視是全國首個實現省級規模三維人像應用的AI公司。

在系統架構方面,分為三個層次,由前端多維智能感知系統、千萬大庫雲端中台和基於大數據的多模態關聯分析與預測後台組成。

在技術架構方面,自下而上分為核心算法層、平台技術層、業務中台層和應用層。在算法層,圍繞3D視覺技術的深度感知算法族、三維重建算法族和人臉識別算法族至關重要。在業務中台層,如何通過數據接入、數據管理、大庫管理和人臉比對算法等各技術模塊的不斷優化,從而提升應用效率至關重要。

再者,的盧深視建立三維數據標準及評價打分體系,這是後續確保三維應用效果的基礎,的盧深視結合實際工程應用經驗,提出了數據質量要求及評價標準。

户磊還總結了的盧深視3D識別的優勢:

準確率高,錯誤率低於萬億分之一,滿足金融支付標準。

魯棒性好,基於深度信息能夠做到不受光線影響,針對大角度、濃妝、多膚色多人種等識別場景,也能夠準確識別。

安全性高,在活體檢測方面,能夠實現2D平面偽裝攻擊方式100%防禦。

以下是户磊演講全文,雷鋒網作了不改變原意的整理與編輯:

的盧深視户磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峯會

的盧深視CEO户磊

大家好!我是的盧深視的創始人兼CEO户磊,今天非常感謝各位行業的專家和嘉賓老師們來聽我分享,也特別感謝主辦方雷鋒網,今年在疫情背景下,AI安防特別需要一個這樣的行業交流機會。

一、大庫時代,千萬級刷臉系統落地面臨的挑戰

任何場景的AI落地都需要有需求,千萬級精準人臉識別是有其需求的,尤其是今年新冠疫情,給我們國家和城市包括應急管理體系、常住人口信息化管理、大交通等在內的領域都帶來了全面的考驗。

其實在這之前已經有相應的趨勢。自改革開放以來,中國從原來的城鄉二元化結構逐步走向全面的城市化,特別是近10年到15年,超級城市不斷湧現。

大家應該能感受到,除了北上廣深以外,原來所謂的二線城市、準二線城市規模逐步增長,千萬級人口的城市不斷出現。

千萬級人口聚集在一個城市,如何管理?如何服務?這是千萬級庫才能解決的問題。

同時,疫情也帶來一個非常重要的課題,之前的城市管理和城市服務更多地是考慮一些特殊人羣,比如公安領域,考慮的是刑偵追逃,刑偵追逃可能是一個幾萬到幾十萬的小庫。

疫情之後,每個人都可能是病毒的攜帶者或者潛在傳播者,這時,不止特殊人羣,我們需要對所有的人進行疫情管控,服務人口的體量一下變成千萬級甚至億級規模。

同時,隨着生活基礎設施越來越便利,在大交通和大出行體系中,出現了城市千萬級人流量在封閉場景中流動的應用。比如地鐵是一個封閉系統,一個城市每天載客客流量在1200萬到1500萬規模,這也屬於大庫管理體系。

再比如金融支付,對安全性要求很高,同時它的庫也很大,支付寶和微信的刷臉金融支付,後台用户數目都是億級規模。

行業會員領域,尤其是一些連鎖店,可能有幾十萬、百萬甚至千萬的會員體系,他們也需要對會員進行精準的身份識別和個性化服務。

這些都是千萬級甚至億級大庫的場景,且都有急切的需求,但是現有方案無法充分滿足需求,主要存在以下幾個問題。

  • 多引擎

公安和安防領域一般採用多引擎的方式,比如一家廠商算法不夠準,就採用多廠商、多算法同時進行,通過多重比對提高識別準確率。

這樣帶來一些問題,一是系統重複建設,資源損耗比較大,整體系統造價很高;二是不同廠商之間系統缺乏統一標準,兼容性也比較差,整個系統很複雜,維護很困難;三是可能這種方式還不能完全滿足需求,還是要通過人工逐級排查實現進一步的精準識別,推動身份的確認。

  • 多層級

很多地方會採用區級、市級、省級逐級排查的方式,這樣會讓不同層級信息無法打通,存在信息孤島,也使得查詢效率低,不具備易用性。

  •  分庫管理

通過特定標準或標籤對庫進行拆分,把大庫變成小庫,然後進行分庫管理和識別,從而提高識別準確率。這也會帶來一些問題,比如統籌管理難度大,而且對於具備多重身份的人,數據會變得冗餘,嚴重影響用户體驗。

總的來説,現有方案會導致系統複雜、軟硬件開銷大、成本高、效率低。

我們迴歸到問題本身,理想的大庫識別方案應該具備哪些特點?

首先,需要是千萬級別底庫;準確率要達到千萬、萬億分之一的誤識別率;魯棒性要好,快速且安全,有足夠的反攻擊能力;性能要開放,能夠支持多模態數據接入,兼容性要好;要經濟實用,方案切實可行且能利舊。

二、標杆案例研讀與標準建庫方案

的盧深視成立於2015年,是最早一批做三維視覺的AI企業,專注三維視覺智能感知技術,在高精度深度感知成像、三維實時高精度重建、三維跟蹤識別及感知等技術方向上,處於國際領先水平。

當時我們就在想,人臉的三維信息經過了精準重建之後能用來幹什麼?這些圖像信息裏有豐富的人臉特徵,加上形狀信息之後,特徵會更豐富,也能支撐更大庫的識別。

所以我們當時就聚焦3D人臉識別這個方向,也非常榮幸,我們承接了一些國家級項目,在某個標杆省份實現了一個省級3D人臉應用,並且在這個基礎之上真正實現了千萬級大庫的精準識別。

這裏介紹的是我們在2015到2016年的一個案例。這是基於的盧深視“哨兵”三維人像多維數據管控通道實現的,通過設備的部署,協助用户實現了全國首個省級規模三維人像應用,後期,我們把它切換成不需要帶證件識別的直接刷臉識別安檢方式。

這個設備本身具備“一次通行、多維採集、關聯碰撞、全面預警”的特性,在實現二維、三維人臉識別的同時還能提供四軌合一的分析,通過集中式管理平台,還可以實現行動軌跡與綜合研判分析。

這個案例當時為什麼能夠做成?大家一般會想,做3D人臉識別首先要建庫,但是用户會覺得麻煩,成本就會特別高。如何在用户能接受情況下幫助用户把庫建設起來,並且實施好整個系統?

的盧深視户磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峯會

上圖是我們當時的一個建設思路,的盧當時採用了“邊建邊用、邊用邊建”的創新模式。

從2D人臉到3D人臉都是在拍人臉,只不過前端的傳感器不同,相機從2D相機換成了3D相機,其實3D相機本身包含2D信息,這在2015年、2016年是比較前瞻性的應用,現在隨處可見,高鐵站的人臉識別設備、酒店前台的人臉識別終端都在應用。

我們當時主要通過四個步驟:

1. 通行人員通過三維終端如配合式設備、通道式設備、抓拍式設備或原有二維終端設備時,終端設備採集通行人員的人臉信息後實時向三維人像庫查詢。

2. 三維人像庫返回比中的人員身份信息。

3. 三維人像庫中暫未錄入通行人員的數據,終端設備向客户已有的二維人像庫查詢,比對通行。

4. 未在庫人員數據自動錄入到三維人像庫中,通行人員下次通行時即可完成三維比對通行。

它主要是通過對身份證信息中的照片和現場拍的圖像做人臉識別比對,準確率可以保證,在這樣的前提下,我們把2D攝像頭換成3D攝像頭,就可以同時採集到3D信息。雖然採集的3D信息質量不一定很高,但是隻要有足夠的應用頻次,就可以幫助用户實現一個高質量的3D數據庫建設,而不需要特地去建一個3D人臉數據庫。這是我們的建設流程。

只要思路轉換後,就會發現幫助用户建庫的方式非常多元,可以有很多入口。人臉取號機、人證核驗設備、手持式的移動終端等,所有需要做認證核驗的終端都可以變成入庫設備,當這些終端應用到生活的方方面面時,採集的效率和頻次就會足夠高,建設速度就將加快且成本低。

的盧深視户磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峯會

這是支撐的盧這一套系統的產品矩陣體系。

三、千萬級刷臉系統關鍵技術點剖析

首先從系統架構來講,我們把千萬級大庫的建庫以及比對系統分成三個層次:

  • 前端多維智能感知系統

核心是的盧深視高性價比3D結構光相機,它深度集成了高性能三維人臉識別算法,降低了後端的計算開銷,保證算法準確率的同時大大降低客户集成成本,形成前端多維智能感知系統。

  • 千萬大庫雲端中台

支持千萬三維大庫人臉建庫、清洗和檢索,精度遠超二維的解決方案,同時,的盧與國產芯片做了深度集成,性能超過同等級國外方案,並且可以與智能前端及邊緣節點協同處理,最優化調度系統內計算資源,提高計算資源利用率,降低系統成本。

  • 多模態關聯分析與預測

在前端感知系統和中台的基礎之上,基於大數據的邏輯推理、時空軌跡關聯分析,將2D/3D人臉、人體、物品、時間、地點以及人體的體貌特徵和形態動作特徵等多維大數據融合,深度挖掘數據之間的關聯性,實現預測預警。

的盧深視户磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峯會

技術架構分為四個層次,分別是核心算法層、平台技術層、業務中台和應用層。

最底層是核心算法層,其中最重要的是3D算法層,基於RGBD全信息處理,在恢復深度信息上我們有一整套深度感知的算法,包括深度對齊、後處理、人臉檢測與跟蹤等等。同時,三維重建算法族也是一個核心層次,它可以真正把一個三維物體的形狀信息進行完整恢復,這是一個非常重要的支撐層次。

在這個核心算法之上,我們有平台技術層,後端的技術包括通信計算、協同優化等技術。

再往上是業務中台,進行數據接入、數據管理、數據清洗、數據優選。因為前面建庫過程中,設備來源非常多元,通過業務中台的一系列數據處理過程後,才能得到優質的數據,然後融到數據庫中進行數據同步,最終支撐各種各樣的應用。

的盧深視户磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峯會

這是整個技術架構。

經過大家多年的摸索,2D人臉庫逐漸形成一套標準,但是3D有深度信息的數據,這些數據如何存儲、有什麼特點、有何技術要求等方面,行業還沒有形成規範。

的盧這些年在這方面不斷探索,建立起一整套數據標準和評價體系。我們希望和行業協同,將它變成一個行業標準。

另外,對於深度識別的設備,即傳感器本身,需要具備怎樣的深度採集能力和精準感知能力?

我們對大庫情形下的識別精度也有一整套測試的方法和標準。市面上通行的相機比較強調絕對精度,但絕對精度對於人臉和人體物體的精細特徵來講,並不是一個非常重要的指標。事實上,相對形狀的相對精度和對於形狀的擬合度是一個比較重要的指標,恢復人臉肌理的特徵也是比較重要的部分。我們有一套深度質量的評價體系,對這些要素進行綜合性的打分,從而形成對前端相機的整體評價。

的盧深視户磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峯會

3D人臉識別技術算法與2D人臉識別有所不同,通常來講,2D人臉識別通過攝像頭獲取圖像數據信息後進行人臉檢測,然後進行特徵提取和信息比對。

而3D的流程比較複雜,前端是符合標準的3D攝像頭,在獲取了圖像數據並進行了人臉檢測之後,還需要進行RGBD數據配準與3D信息重建,把人臉信息進行完整的三維恢復。同時,在恢復的三維人臉模型上提取三維人臉特徵,最後進行比對。

在後台應用上,我們一整套後台應用服務器,能夠單獨部署,也可以集成部署,並且支撐高併發請求的快速處理和及時響應。

同時,我們針對寒武紀MLU270的體系結構特點改進了深度學習網絡結構,設計最佳併發處理模式,提高吞吐率,充分利用硬件平台算力。在保證精度基本不損失的情況下,突破了三維人臉識別算法的INT8量化技術。

的盧深視户磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峯會

另外強調一下多模態架構的理念。物理世界中的物體都是3D的,獲取到完整的3D信息對於系統精準感知和識別的進一步提升非常重要,換句話説,增加數據維度是最有效提升系統感知能力的方式,可以以此突破深度學習發展的瓶頸。

我們認為,多模態的架構是未來的趨勢,3D也只是這個多模態架構中的一個方向,但它是一個比較易得的方向,因為它不會改變原來2D人臉識別中各種各樣的交互和體驗,同時還能提升整個系統的準確性和完全性。當然,以後我們還會融合更多技術,把這個系統做的更好、更安全、更可靠。

總結一下3D識別的優勢:

  • 準確性高。千萬大庫下錯誤率低於萬億分之一,具有極高的安全性。

  • 魯棒性好。不受光線影響,可以實現7X24無間斷地安全保障,對於大角度、濃妝識別的準確率更高,體驗感也更好,大角度可識別;對不同膚色人種識別率幾乎不受影響。

  • 安全性高。對於活體檢測,可以做到2D平面偽裝攻擊方式100%防禦。

總結一下的盧深視大庫識別方案。精準,可以做到萬億分之一誤識別率;具備千萬級別底庫前提下精準識別的能力;高效,魯棒性好,快速且安全;支持多模態,兼容性好;具有切實可行的建設方案,可利舊,性價比高。

四、的盧深視提供“三維全棧”技術支撐

最後對的盧深視做一個簡單介紹。

的盧深視公司基於三維機器視覺和人工智能技術,提供實體空間人像身份、行為、軌跡的精準感知和整體解決方案。公司團隊是國內極少在深度感知成像、三維重建、三維識別測量定位等全棧式三維技術領域具備國際領先能力的原創團隊。

我們認為3D是一個很大的賽道,這個賽道中的關鍵點不僅在於算法,還在於硬件傳感器,它要面對不同的應用場景。我們常提到的開放場景的空間傳感和識別,物體的傳感和識別,都是我們的研究方向。

我們總部在北京,在合肥、杭州都有研發中心,深圳是我們的營銷中心,同時我們在很多地方建設了本地化的服務網絡,跟很多高校也有深度合作。

我們的技術定位,是以“人”為標的物,構建“光電+算法”全棧3D機器視覺及其智能架構。

我用“機器視覺”這個詞呼應一下前面華為機器視覺總裁段愛國講的,我們也認為,以後視覺的發展核心不再是給人看,而是給機器看。3D在這個環節中是非常重要的一個元素。

的盧深視户磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峯會

因為圖像視覺發展多年,都是圍繞讓人眼看着更好去不斷演進的,3D的數據,特別是深度數據,是人眼不太能感知到的數據,或者説人眼對這個數據不太敏感,但是對機器很重要,機器需要這些更豐富、更準確、更相關的數據來更好的完成它的任務。

其實光本身的信息中還有很多諸如相位、偏振態的信息,這些都可以進一步提升機器視覺應用的準確性和安全性,從而擴展它應用的範圍。

在這個維度中,我們主要是聚焦於人全息特徵的精準識別和分析,在3D人臉方向,我們經驗比較豐富,另外,我們也在研究人的體貌特徵分析技術,以及結合各種各樣的數據實現精準的識別的應用。

從基礎研究路徑看,3D與2D不同,3D傳感器非常重要,但目前還處於產業初級階段。算法、數據、傳感和應用,這四個維度交織演進,是我們終極的技術演進路徑。

的盧深視户磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峯會

最後回到今天的主題,隨着人臉識別在各行各業得到更多用户的認可,千萬級大庫應用的進一步升級也會成為重要課題。任何一個系統隨着廣泛的應用都受到更多的關注,也會催生更多新的需求,我們堅持回到技術本身,從技術上提升應用能力。雷鋒網雷鋒網雷鋒網

版權聲明:本文源自 網絡, 於,由 楠木軒 整理發佈,共 5961 字。

轉載請註明: 的盧深視户磊:大庫時代,落地千萬級刷臉系統的技術剖析與建庫經驗 | AI 安防峯會 - 楠木軒