近日,堪稱計算機視覺領域「奧斯卡」的國際頂會CVPR 2020首次以線上形式拉開帷幕。在本屆大會與智慧交通關係最緊密的AI CITY Challenge和MOTS Challenge兩大挑戰賽中,百度一舉擊敗阿里、滴滴、卡內基梅隆大學等參賽者,斬獲4項世界冠軍及1個榜單冠軍,併成功衛冕1項冠軍,再度彰顯了百度在「新基建」的大潮下,在智慧交通和智慧城市領域領先的技術實力。此外,百度本次奪冠也與飛槳的強力支撐密不可分。
AI CITY智慧城市挑戰賽由英偉達、亞馬遜、馬里蘭大學等主辦,主要集中在交通相關的車輛跟蹤、再識別、異常事件分析等應用場景。MOTS (Multi-Object Tracking and Segmentation)多目標跟蹤與例項分割挑戰賽由德國慕尼黑大學、德國亞琛工業大學、ETH聯合舉辦,是多目標跟蹤方向的權威競賽。
兩項挑戰賽均是計算機視覺頂會CVPR的議程之一,每年吸引眾多企業與高校參賽者。同時,其所有資料均從實際場景採集獲得,存在劇烈的鏡頭抖動、影象模糊等工業環境中存在的問題。完成與實際業務落地場景“零差距”的嚴苛考驗,可以直觀反映參賽者真實的應用能力。
奪勇智慧城市挑戰賽3項冠軍 自研智慧交通系統原力爆發
AI CITY智慧城市挑戰賽的4項比賽中,全球共有315支隊伍參加,其中不乏阿里、滴滴、松下、卡內基梅隆大學等一流科技巨頭和高校。百度共參戰3項競賽,最終技壓群雄,全部取得了冠軍成績:
1、車流統計(Track 1:Multi-Class Multi-Movement Vehicle Counting);
2、車輛再識別(Track 2:City-Scale Multi-Camera Vehicle Re-Identification);
3、異常事件檢測(Track 4:Traffic Anomaly Detection)。
百度勇奪AI CITY挑戰賽三項冠軍
其中,車輛重識別賽道今年更是成功衛冕,異常事件檢測最終得分超第二名近50%。冠軍的矚目成績源於背後技術的厚積薄發,也是百度技術創新性的證明:
1、在車流統計任務中,提出平滑馬氏距離、漏檢框召回最佳化等多目標跟蹤改進演算法,結合基於軌跡形狀相似度的車道分類方法,整體方案綜合指標達到91.8%;
2、在車輛再識別任務中,透過採用3D渲染資料編輯、複雜負樣本增強、多資訊融合等技術,最終mAP指標大幅領先第二名6%以上;
3、在異常事件檢測任務中,提出雙向多粒度融合異常檢測演算法,使得異常事件準確率高達98%以上。
據知,上述的百度奪冠技術均已應用於百度自研的智慧交通系統,該系統整合了檢測、跟蹤、3D定位、分割、身份重識別、事件分析在內的一攬子視覺技術,成為保障業務落地的堅實基礎。
其中,可分析車流資料發現交通擁堵的車流統計技術,智慧交通系統中確認車輛身份的車輛再識別技術,以及可準確發現潛在交通風險的異常事件檢測技術,均是目前智慧交通領域的典型服務。
多目標跟蹤與分割難度大 百度斬獲2項第一
多目標追蹤(MOT)是影片理解和分析領域的核心技術之一,廣泛應用於智慧城市、智慧交通等實際場景。MOTS挑戰賽在上年基礎上,進一步結合例項分割與多目標追蹤兩大挑戰性任務,要求參賽者在追蹤場景中人與車的同時進行畫素級解析,競賽難度極大提升。
KITTI-MOTS是自動駕駛權威資料集KITTI中多目標跟蹤任務的擴充套件,包括21段訓練影片以及29段測試影片,每一段影片均提供了所有物體(人和車)的例項分割標註,成為首個同時提供例項分割以及多目標跟蹤標註的公開資料集。
百度同時參戰了MOTS和MOT競賽任務,最終憑藉原創自研的領先技術,在KITTI-MOTS賽道以及MOT20榜單中均斬獲第一。
百度拿下KITTI-MOTS競賽冠軍和MOT20榜單冠軍
具體而言,在KITTI-MOTS競賽中,百度提出新型方法PointTrack ,在行人和車輛兩個類別中均取得冠軍。PointTrack 包括影片例項分割、掩膜特徵提取以及多目標關聯跟蹤等技術,突破性地把3D點雲分析融入2D MOTS任務之中,首次實現實時線上的MOTS演算法,並在車輛場景測評指標上領先第二名3個百分點以上,實現SOTA結果。
繼去年MOT16奪冠之後,百度繼續在2020年最新的多目標追蹤榜單MOT20上進行了測試。相比往年,MOT20使用一批全新的訓練/測試資料集,場景行人高度密集,具有富有挑戰性。在行人更高度密集的複雜場景下,百度取得了MOT20榜單第一的優異成績。
KITTI-MOTS競賽中演算法視覺化展示
左圖為MOT16演算法視覺化展示,右圖為MOT20演算法視覺化展示
飛槳為百度奪冠提供強大技術支撐
百度AI奪冠的背後,離不開深度學習框架飛槳(PaddlePaddle)的強大支撐,它為百度的參賽起到了保駕護航的作用,上述的百度冠軍方案均基於飛槳而構建,主要體現為以下3點:
1、挑戰賽使用的檢測模型均基於PaddleDetection而打造;
2、飛槳豐富且領先的預訓練主幹網路模型和完備的操作池,大幅縮短開發高精度模型的週期;
3、PaddleClas SOTA模型豐富,為快速構建再識別任務提供了保障。
值得一提的是,挑戰賽冠軍模型也已面向公眾開放,這進一步提升了飛槳的技術能力和易用性,助力百度以便捷的方式,領先的深度學習技術能力賦能產業。
比如,上述奪冠技術已成功應用於國內第一個民用無人車產品長沙Robotaxi的車路協同系統之中,藉助PaddleLite定製化提升模型效能,即使算力有限,仍可保障系統魯棒執行。
Apollo技術持續突破 助推智慧交通新基建迅猛落地
透過不斷參與國際頂尖挑戰賽,技術正在不斷重新整理能力的邊界。正是這些持續突破的核心技術能力,有力地支撐著百度在新基建大潮下,在智慧交通、智慧城市領域的高效落地。
在發改委明確的「新基建」範圍中,智慧交通領域正是國家點名的重要融合基礎設施。百度Apollo智慧交通,已經在長沙和滄州率先落地,同時還有若干城市的合作正在推進中。
百度AI新基建版圖
「ACE交通引擎」Apollo智慧交通方案透過統一的底座支援多種應用,是全球第一個具有路側全息感知能力的自動駕駛車路協同系統,並服務於Robotaxi車隊的日常開放道路測試運營。
基於上述同一套軟硬體系統的智慧路口輸出更精準的交通流指標感知結果,支援實現更智慧的訊號燈最佳化控制,顯著緩解高峰期幹線擁堵,實現「燈看車、燈看人」的智慧訊號燈感應式控制,並透過百度地圖手機APP服務於廣大出行使用者。
百度智慧城市也已經逐漸落地北京、重慶等地,成為新一代城市智慧基礎設施,讓城市更安全、更從容、更通暢、更宜居。憑藉完備的技術佈局和深厚的技術底蘊,百度正在新基建的浪潮中發揮重要作用,頂級AI技術正深入各行各業,撬動著未來可期的智慧時代。