作為人工智能核心能力,細粒度圖像分類是計算機視覺領域極具挑戰的方向,而且技術要求越來越高。只有讓機器「看得」更細更準,機器的判斷才能有所突破。細粒度圖像分類針對的是更微觀的物體類別,比如,全世界品種超過幾萬種的蘭花,AI 不僅要識別出它是一種蘭花,還要判斷具體屬於哪一種蘭花,如果要識別手機,要分辨出是什麼品牌的哪一種型號。
再比如生了病的兩片樹葉,同樣出現了破損孔洞,在傳統模型訓練下,AI 最多可以識別出它們都是蘋果樹的樹葉,很難確定兩個孔洞之間的區別,進而給出推斷樹葉究竟得的是哪兩種疾病。然而現在支付寶的 AI 模型通過明確識別關鍵是孔洞大小、數量、位置,以及周邊是否有斑點,最終快速給出樹葉由於化學藥品濫用造成損傷的判斷。
實際上,世界上的約 37 萬種植物,不同植物的病因完全不同,但它們的病態外觀和特徵卻非常相似。另一方面,採集拍攝中存在姿態、視角、光照、遮擋、背景干擾等影響因素,使分類更加具有難度。
然而這就是近日在計算機視覺 A 類頂級會議 CVPR 2020 開幕在即,圍繞該方向 Kaggle 共發起六項任務,國內互聯網公司支付寶參加了其中的患病植物圖像分類。
這個挑戰非常難,比賽考察 AI 視覺識別技術對蘋果樹葉子圖片進行不同種類的疾病區分能力,在訓練集 1821 張圖像和測試集 1821 張圖像中,完成高精確度的判別。
最終,在FGVC(Fine-Grained Visual Categorization,細粒度圖像分類)全球挑戰賽結果中,支付寶天筭 (suàn) 安全實驗室在 1316 支參賽隊中奪冠。
支付寶天筭安全實驗室使用的原創模型,是基於數據增強、知識蒸餾方法,實現在大量信息干擾下進行物體具像化特徵識別,使細粒度識別精度大幅提升。支付寶是比賽中唯一使用知識蒸餾這種深度學習方法的團隊,在最終測試中,支付寶分數達 0.98445,排名第一。(創見張超編輯報道)