全景分割新突破，創新奇智榮獲MIT場景解析評測世界冠軍

2020-07-22 由老巧雲發佈於科技

近日，創新奇智憑藉突破性的AInnoSeg全景分割算法，刷新MIT Scene Parsing Benchmark 場景解析任務世界最好成績，領先商湯科技（2020年3月、5月為該基準測試的世界冠軍）、北京大學、南京大學、騰訊等眾多知名公司和研究機構，以絕對優勢獲得冠軍。

來源於：(請戳此處）

關於ADE20K數據集

MIT Scene Parsing Benchmark 致力於為場景感知、場景解析、實例分割和語義理解等計算機視覺技術提供訓練和性能標準化評估平台。該基準測試的數據來自ADE20K數據集，以場景目標複雜、目標尺度變化範圍大等特點著稱，共包含150個類別，覆蓋人類生活各個方面的場景，裏面同種類的物體在不同場景中表現出的大小、比例、姿態差別非常大，並且不同物體之間存在遮擋嚴重的問題，是全球範圍內公認的最具挑戰性、權威性、代表性的場景解析評測集，在AI相關技術領域受到廣泛關注和高度認可，吸引着眾多國際知名企業、學術研究機構集中參與。ADE20K數據集在圖像分割領域意義重大，是世界計算機視覺三大頂級會議（CVPR、ICCV和ECCV）語義分割論文權威基準數據集。

ADE20K數據集

創新奇智的AInnoSeg算法

目前最優的全景分割算法無法解決圖像中物體邊緣像素的分割和小物體的分割準確性。創新奇智提出的AInnoSeg算法卻能有效地解決這些問題。AInnoSeg算法首先使用基於Nonlocal network修改的pixel and channel attention網絡結構來嫁接在HRnet上面，這樣能夠精確地對圖像中每個像素進行分割；然後連接一個OCRnet網絡結構對圖像中每個物體和屬於這個物體的像素進行聯繫，從而能夠讓算法更加關注物體自身的像素和邊緣像素；然後使用數據增強的方式，讓算法更加關注圖像中小物體的分割。同時使用多個輔助損失函數來完成訓練。

HRnet網絡結構

其次，AInnoSeg提供了半監督的訓練模型流程，可以在數據集比較少的情況下，提升算法模型的表現力。

半監督訓練流程圖

AInnoSeg算法實現細節論文：（請戳此處）

我們來看看AInnoSeg算法在ADE20K數據集上面的表現。

AInnoSeg算法相比較於目前最優的分割算法，能夠有效地分割物體邊緣和小物體的分割

全景分割的落地應用

圖像分割是計算機視覺領域的重要任務，有着眾多的應用場景。本次大賽創新奇智奪冠的AInnoSeg全景分割算法已經應用到創新奇智ManuVision工業視覺平台和MatrixVision視頻智能平台，用於工業製造過程的產品質量管控，以及生產園區的車輛檢測、行為分析等各類複雜現實場景。

創新奇智不僅擁有業界領先的計算機視覺技術 — 連續刷新人臉檢測競賽WIDER FACE、物體檢測競賽 PASCAL VOC、實例分割競賽Cityscapes、多目標跟蹤競賽MOT Challenge等多個世界頂級計算機視覺大賽的全球排行榜，以2%的概率入選計算機視覺頂會ECCV 2020 Oral論文；還注重將技術商業化落地，在IDC中國人工智能市場報告中，躋身中國人工智能市場計算機視覺應用主流供應商，市場份額位居第6，是2018-2019 YoY增速最快企業。

創新奇智CTO張發恩表示：“創新奇智重創新，更重實踐，研發能解決實際問題的AI算法，推動人工智能與實體產業的融合發展。未來，創新奇智將探索包括圖像分割在內的計算機視覺技術在更多細分場景的應用落地，助力產業智能化。”

雷鋒網雷鋒網

轉載請註明：全景分割新突破，創新奇智榮獲MIT場景解析評測世界冠軍 - 楠木軒