AI屆的「最強大腦」能精準區分同種類物體的細微差別

2020-06-12由司馬盼香發佈於科技

作為人工智能核心能力，細粒度圖像分類是計算機視覺領域極具挑戰的方向，而且技術要求越來越高。只有讓機器「看得」更細更準，機器的判斷才能有所突破。細粒度圖像分類針對的是更微觀的物體類別，比如，全世界品種超過幾萬種的蘭花，AI 不僅要識別出它是一種蘭花，還要判斷具體屬於哪一種蘭花，如果要識別手機，要分辨出是什麼品牌的哪一種型號。

再比如生了病的兩片樹葉，同樣出現了破損孔洞，在傳統模型訓練下，AI 最多可以識別出它們都是蘋果樹的樹葉，很難確定兩個孔洞之間的區別，進而給出推斷樹葉究竟得的是哪兩種疾病。然而現在支付寶的 AI 模型通過明確識別關鍵是孔洞大小、數量、位置，以及周邊是否有斑點，最終快速給出樹葉由於化學藥品濫用造成損傷的判斷。

實際上，世界上的約 37 萬種植物，不同植物的病因完全不同，但它們的病態外觀和特徵卻非常相似。另一方面，採集拍攝中存在姿態、視角、光照、遮擋、背景干擾等影響因素，使分類更加具有難度。

然而這就是近日在計算機視覺 A 類頂級會議 CVPR 2020 開幕在即，圍繞該方向 Kaggle 共發起六項任務，國內互聯網公司支付寶參加了其中的患病植物圖像分類。

這個挑戰非常難，比賽考察 AI 視覺識別技術對蘋果樹葉子圖片進行不同種類的疾病區分能力，在訓練集 1821 張圖像和測試集 1821 張圖像中，完成高精確度的判別。

最終，在FGVC（Fine-Grained Visual Categorization，細粒度圖像分類）全球挑戰賽結果中，支付寶天筭 (suàn) 安全實驗室在 1316 支參賽隊中奪冠。

支付寶天筭安全實驗室使用的原創模型，是基於數據增強、知識蒸餾方法，實現在大量信息干擾下進行物體具像化特徵識別，使細粒度識別精度大幅提升。支付寶是比賽中唯一使用知識蒸餾這種深度學習方法的團隊，在最終測試中，支付寶分數達 0.98445，排名第一。（創見張超編輯報道）