深度學習以大數據為驅動,對挖掘生態資源信息進行目標分類識別、檢測定位、語義分割、實例分割和迴歸預測帶來了新的機遇。但在數據的標準化和共享化、算法的普適性和解釋性,以及應用的豐富化和智能化方面仍充滿挑戰。中國科學院植物研究所郭慶華研究員和博士生金時超等共同撰寫的“深度學習在生態資源研究領域的應用:理論、方法和挑戰”一文近期在《中國科學:地球科學》發表,該研究闡明瞭上述前沿問題。
隨着數據的積累、算力的提升和算法的進步,深度學習在諸多領域取得了顯著進步。文章圍繞生態資源領域的應用需求,對深度學習能解決的任務、存在的問題和未來的發展進行總結與展望,主要內容包括:
(1)概述了深度學習的起源、發展(圖1)和基本結構。分析了以卷積神經網絡、循環神經網絡和圖神經網絡為代表的深度學習結構與生態資源大數據研究的關係(圖2)。
(2)總結了深度學習在生態資源中的主要任務,概括了生態資源領域的常見公開數據集和工具(圖2)。
圖1 深度學習的起源與發展
圖2 深度學習網絡基本結構及其在生態資源中的應用
(3)展示了深度學習在植物圖像分類、作物表型和植被製圖中的應用。分析了深度學習在結構化和非結構化生態數據中的應用能力和潛力。
(4)展望了深度學習在生態資源領域應用中的挑戰和前景(圖3),包括數據的標準化和共享化體系建設、眾源採集平台構建;深層神經網絡的可解釋性、結合領域知識的模型組合和優化、小樣本學習和地學背景環境信息學習;數據融合和學科交叉應用、算法推理和生態資源管理規劃。
圖3 生態資源領域被深度學習浪潮帶來衝擊(水體與近水體部分)和未來亟待解決的領域(山體部分)
這一研究結果探索了深度學習與生態資源研究的關係,對於連接計算機科學領域的技術前沿與生態資源領域的經典理論科學具有重要意義,有利於加速生態資源大數據時代的理論發現和科學研究新範式的建立。