世界第一!華為雲EI問鼎國際影象識別領域“世界盃”

【環球網智慧綜合報道】近日,在第四屆國際影象識別競賽WebVision中,華為雲EI 以82.97%的準確率擊敗來自全世界的94支參賽隊伍獲得冠軍。WebVision 競賽由蘇黎世聯邦理工(ETH)、Google Research、卡耐基梅隆大學(CMU)等共同組織,是目前影象識別領域最權威的競賽之一,被業界譽為人工智慧“世界盃”,接棒曾經推動計算機物體分類準確率超過人類的ImageNet 競賽。

世界第一!華為雲EI問鼎國際影象識別領域“世界盃”

WebVision競賽要求參賽的AI模型將1600萬 張圖片精準分類到5000個類目中。大賽所用資料集直接從網際網路爬取,沒有經過人工標註。因此資料中含有很多噪音,且資料類別的數量存在著極大不平衡,相較於 ImageNet,WebVision 難度提高許多,同時也更加貼近於實際應用中的場景。

WebVision競賽展示了人工智慧技術發展的另外一種可能性:基於弱監督學習,深度學習可以不再以人工標註資料為基礎,人工智慧有望真正擺脫“人工”。

世界第一!華為雲EI問鼎國際影象識別領域“世界盃”

此次競賽中,華為雲EI基於ModelArts訓練大規模影象分類模型,基於先進的分散式訓練方法,可以縮短超大規模資料集的訓練時間。利用伴隨影象資料的文字描述資訊,融合文字與視覺多模態特徵,透過訓練過程中的動態評估識別並剔除大量噪聲資料,並進一步透過知識蒸餾降低噪聲對模型訓練的影響,最終在完全沒有人工標註的情況下,從網際網路上自動爬取的大規模資料集上進行學習,訓練得到準確率82.97%高精度模型。

世界第一!華為雲EI問鼎國際影象識別領域“世界盃”

華為雲EI在本次比賽中運用的影象識別技術,可廣泛用於通用物品識別、影象/影片標籤等領域。近十年來計算機視覺取得的進展離不開大量人工標註的資料集,但由於人工標註需要較高的成本,幾乎不太可能構建包羅永珍的超級資料集。網際網路上存在幾乎取之不盡的無標註影象資料,利用這些資料的周邊文字等資訊作為帶噪聲的弱標註資料進行學習,能夠在很大程度上降低影象識別對人工標註的依賴。

華為雲EI在視覺研究領域有著豐富的技術積累,在6 月14日-19 日舉辦的CVPR2020(國際計算機視覺和模式識別大會) 中,華為貢獻論文34 篇,涵蓋遷移學習、半監督學習、網路架構搜尋、模型運算元最佳化、知識蒸餾、對抗樣本生成等前沿領域。展示了華為在計算機視覺領域強大的人才儲備、科研底蘊和創新能力。

華為雲EI在行業應用上亦有豐富的商用實踐經驗。目前,華為雲EI內容稽核、人臉識別、影象搜尋、影片分析等服務已經成功應用於網際網路、媒資、園區、物流、工業等行業。華為雲還將影象識別技術應用於天文、氣象等領域。2019年基於華為雲圖像識別能力,在上海天文臺與國際組織SKA(平方公里陣列射電望遠鏡) 合作的專案中,科學家們僅用10.02 秒即完成了對 20 萬顆星體的識別,同時可以準確地對某一類星體進行定位,傳統方式完成如此大量的星體識別工作需要 169 天時間。

版權宣告:本文源自 網路, 於,由 楠木軒 整理釋出,共 1197 字。

轉載請註明: 世界第一!華為雲EI問鼎國際影象識別領域“世界盃” - 楠木軒