作為生物識別技術的一種,搭載人臉識別功能的各類智慧化產品已應用得非常普遍。但從產品體驗而言,使用者的感受卻不盡相同。比如有能夠在腳踏車騎行狀態下,無需下車實現快速無感通行的小區人臉識別閘機。同時也會在使用部分產品時,遇到多次識別不透過、站在原處不停變換人臉角度等待識別透過的尷尬。
造成這一差距,除了演算法自身魯棒性和效能之外,由於模糊、遮擋、大角度、逆光暗光等複雜環境引起的人臉影象質量問題也會導致人臉識別準確率過低,需要多次重複識別才能成功,從而整體耗時被大大拉長。
我們知道當影象質量越差,那麼人臉識別的準確率就越低。如果可以將人臉影象進行標準化評估,去除低質量圖片,將篩選後質量符合標準的影象才送往下一個流程中,那麼識別效率將大大提升。這就是實現人臉識別無感通行的一項重要技術——影象質量檢測演算法(FQ),《從零學習人臉識別》系列公開課第六期就對該演算法進行了詳細介紹。
人臉影象質量檢測演算法的原理
與人臉識別一樣,影象質量檢測演算法(FQ)也是基於特徵提取原理,透過神經網路從海量資料中學習獲取人臉質量檢測關注的特徵(主要包括光線、模糊、角度、遮擋、表情、噪聲等)並進行質量判斷。每個特徵以特定的數值來表示,比如下圖的人臉特徵向量為(0,1,0,1,1),即強光、中度模糊、中等遮擋、大角度、大表情。
當然,這個特徵向量可以無限擴充,將特徵的描述越細緻,特徵向量就越精確,光線可以增加暗光、低光,模糊可以增加輕微模糊、中等模糊。以虹軟視覺開放平臺的影象質量檢測演算法為例,在噪聲特徵中甚至可以擴充到六十四位以上的特徵。
在提取特徵向量後,各張人臉圖片的特徵雜亂無序地分佈在向量空間裡。此時,透過對資料進行學習,質量好的樣本儘可能聚集在中間,而不好的被推離。最後根據計算樣本到圈中心的距離,得到一個質量分數。
每個特徵對質量分數的影響各不相同,我們需要根據各自業務需求設定相應的閾值,FQ會將低於設定閾值的低質量影象過濾,從而確保輸送到後面人臉識別環節的影象質量都是比較好的。
人臉影象質量檢測演算法的經典應用
將人臉質量檢測放到真實的使用場景中,情況會怎麼樣?以下是基於,包含人臉檢測、活體檢測、人臉比對、人證比對等一系列功能在內的虹軟視覺開放平臺免費、離線SDK ArcFace,所開發的智慧辦公刷臉門禁。
一名使用者從遠處走來,由於距離原因,系統首先捕捉到的是比較模糊的人臉影象。而後,FQ演算法會自動進行判斷,由於質量過低該影象會被拒絕送往下一個識別環節中。隨後系統會繼續捕捉,直到一張質量較好的人臉影象被送往識別併成功。整個過程使用者無需刻意停留等待,即可一次完成人臉識別。
而如果在沒有加入FQ演算法的情況下,首次捕捉到的模糊照片被送入下一個人臉識別環節中。當這張人臉圖片在識別失敗後,系統就需要再捕捉一張圖片,進行第二次識別、甚至第三次識別。如此,使用者基本將難以實現無感快速通行。
從對比實驗中,所感受到的差異就已經非常明顯,如下圖所示:相比沒有FQ的情況,增加了FQ的人臉識別系統每個環節耗時平均減少約30%。
同樣,在批次進行人臉識別底庫註冊時,往往會有上萬張圖片。普通的人工篩選,很難完成影象質量檢測。而FQ演算法可以快速完成篩選,讓人臉識別從底庫的特徵值開始就更加準確。
作為一款輔助演算法,我們在選型時要更多地考慮整體,FQ不能佔用太大空間和耗時。比如上面“智慧辦公刷臉門禁”實驗中選擇的虹軟視覺開放平臺所開發的FQ演算法,其模型小,能在確保精度的前提下儘可能提升檢測速度。
此外需要注意的是,不同專案、不同環境對質量好的定義各有不同。比如公司刷臉門禁和絕密實驗室的刷臉門禁,兩者對攝像頭成像效果的定義當然就有所區別。這時候,開發者就得根據不同專案需求進行攝像頭的單獨調參,從而分支出不同場景的版本。
其他關於人臉質量檢測的相關問題, 第六期“虹軟視覺開放平臺人臉公開課”都有具體解答,感興趣的開發者朋友可以點選下方連結觀看完整影片。或者自行搜尋“虹軟視覺開放平臺人臉公開課”,隨時可以學習。
【ZOL客戶端下載】看最新科技資訊,APP市場搜尋“中關村線上”,客戶端閱讀體驗更好。
(7527527)