深度学习以大数据为驱动,对挖掘生态资源信息进行目标分类识别、检测定位、语义分割、实例分割和回归预测带来了新的机遇。但在数据的标准化和共享化、算法的普适性和解释性,以及应用的丰富化和智能化方面仍充满挑战。中国科学院植物研究所郭庆华研究员和博士生金时超等共同撰写的“深度学习在生态资源研究领域的应用:理论、方法和挑战”一文近期在《中国科学:地球科学》发表,该研究阐明了上述前沿问题。
随着数据的积累、算力的提升和算法的进步,深度学习在诸多领域取得了显著进步。文章围绕生态资源领域的应用需求,对深度学习能解决的任务、存在的问题和未来的发展进行总结与展望,主要内容包括:
(1)概述了深度学习的起源、发展(图1)和基本结构。分析了以卷积神经网络、循环神经网络和图神经网络为代表的深度学习结构与生态资源大数据研究的关系(图2)。
(2)总结了深度学习在生态资源中的主要任务,概括了生态资源领域的常见公开数据集和工具(图2)。
图1 深度学习的起源与发展
图2 深度学习网络基本结构及其在生态资源中的应用
(3)展示了深度学习在植物图像分类、作物表型和植被制图中的应用。分析了深度学习在结构化和非结构化生态数据中的应用能力和潜力。
(4)展望了深度学习在生态资源领域应用中的挑战和前景(图3),包括数据的标准化和共享化体系建设、众源采集平台构建;深层神经网络的可解释性、结合领域知识的模型组合和优化、小样本学习和地学背景环境信息学习;数据融合和学科交叉应用、算法推理和生态资源管理规划。
图3 生态资源领域被深度学习浪潮带来冲击(水体与近水体部分)和未来亟待解决的领域(山体部分)
这一研究结果探索了深度学习与生态资源研究的关系,对于连接计算机科学领域的技术前沿与生态资源领域的经典理论科学具有重要意义,有利于加速生态资源大数据时代的理论发现和科学研究新范式的建立。