澎思科技(Pensees)官方宣佈其再次在單幀圖片數據集(Market1501,DukeMTMC-reID,MSMT17)刷新世界紀錄,大幅提升了跨域ReID算法的準確率。
此前,澎思科技曾在三大主流單幀圖片行人再識別數據集、三大主流視頻行人再識別數據集刷新世界記錄。
據瞭解,澎思科技此次成果的取得源於澎思新加坡研究院對算法的自研創新和融合探索。本次,澎思科技將對抗生成網絡與自監督學習算法結合進行模型的訓練,通過遷移學習,進行高準確率的跨場景(數據庫)行人再識別算法的研發,取得了突破性進展 。
澎思科技方面表示,該突破對於行人再識別技術在應用場景中的落地具有重要的意義。
澎思科技對行人再識別(ReID)算法進行了長期關注的研究。行人再識別(ReID)算法能夠通過視頻監控系統,在跨攝像頭的條件下檢索行人,大大拓展攝像資源的利用深度。特別在公共安全領域,ReID可以彌補人臉識別的侷限,提升對特定人物的識別追蹤能力,並大大降低人力成本。然而相比人臉識別的百萬級數據庫,行人再識別面臨着數據量不足和複雜應用場景變化的挑戰。因此,展開高準確率的跨場景(數據庫)行人再識別算法研究對於行人再識別技術的應用落地十分重要。
此次澎思科技刷新的ReID三大數據集,除了Market1501,DukeMTMC-reID兩大常見數據集之外,還包含了MSMT17數據集。MSMT17,即Multi-Scene Multi-Time,是在CVPR 2018上提出的一個更接近真實場景的大型數據集,涵蓋了多場景多時段,是目前最賦有挑戰性的綜合跨場景大數據集。與之前的數據集相比,該數據庫中行人和攝像頭數目更多,覆蓋場景更復雜,時間跨度更廣。因此,在該數據集下模型的表現更能體現出算法的實力。
MSMT17 數據集與其他數據集的直觀對比
最終,通過與目前最新的主流算法進行對比,澎思科技的ReID算法無論在首位命中率(Rank-1 Accuracy),還是平均精度均值(Mean Average Precision,mAP)上的表現都明顯更好,準確率更高。
本次,澎思科技創新性地將對抗生成網絡與自監督學習算法結合進行模型的訓練,通過遷移學習,進行高準確率的跨場景(數據庫)行人再識別算法的研發,取得了突破性進展。
對抗生成網絡在算法中主要有兩個功能:一方面,進行數據庫的域遷移,具體為原域到目標域的風格遷移;另一方面,進行目標域數據庫的數據增強,具體為生成跨攝像頭數據並給模型賦予相機風格不變的約束。自監督學習則是通過聚類的方式給目標域數據庫打虛擬標籤並微調之前訓練好的網絡。
源域模型訓練
目標域模型自監督學習
近年來,單域行人再識別(Single-Domain Person ReID)取得了巨大進展,但與實際應用場景的要求還存在較大差距,跨域行人再識別(Cross-Domain Person ReID)的研究意義愈發顯著。隨着人工智能的不斷髮展演進,如何通過自動遷移學習、自監督學習、GAN等前沿技術實現模型優化,成為跨域行人再識別的重要研究方向。
澎思科技此次創新性地通過遷移學習提升了目標場景下的ReID性能,突破了行人再識別的落地應用限制,真正發揮了ReID的算法作用和技術優勢,為行人再識別算法在各類產品和應用場景中的落地打下基礎。