冯利民副教授教授团队发文首次构建了适用于温带针阔叶混交林生态系统的野生动物数据集

作者:东北虎豹多样性国家野外科学观测研究站

9614b2d875df4a01ee6f6984c160035.png

作者:谭孟雨(第一作者),晁文涛(第一作者),程若谷,周末,马依雯,蒋欣怡,葛剑平,于濂(通讯作者),冯利民(通讯作者)

论文链接:https://doi.org/10.3390/ani12151976

2022年8月,北京师范大学东北虎豹多样性国家野外科学观测研究站冯利民教授团队在Animals发表论文“Animal Detection and Classification from Camera Trap Images Using Different Mainstream Object Detection Architectures”。该研究首次构建了适用于温带针阔叶混交林生态系统的野生动物数据集——东北虎豹国家公园数据集(NTLNP dataset),并比较了目前主流的三种基于深度学习的目标检测框架在该数据集上的实际应用性能。该研究为人工智能技术在野外真实场景下的野生动物自动识别提供参考,助力大尺度红外相机产生的生态大数据处理和挖掘工作。

红外相机监测技术广泛应用于野生动物调查和生物多样性监测。由于其触发机制,有时会积累大量图像或视频。一些研究提出可以应用深度学习模型自动识别红外相机图像中的野生动物,这可以大大减少人工操作时间,加快分析过程。然而,很少有研究验证和比较在实际野外监测场景中,不同模型在该任务下的适用性。在本研究中,我们首先构建了包含人类活动,家畜及东北虎豹国家公园主要野生物种的图像数据集(NTLNP dataset),共计17个类别,20 k张人工标注图片。此外,我们还评估了目前主流的三种物体检测架构的识别性能,以及不同训练策略下模型的性能差异。在实验中,我们选择了YOLOv5系列(基于锚框的单阶段模型)、使用特征提取器HRNet32的Cascade R-CNN(基于锚框的双阶段模型)以及使用特征提取器ResNet50和ResNet101的FCOS (无锚框的单阶段模型)。实验结果表明,昼夜联合训练的目标检测模型性能更令人满意。具体来说,我们的模型在动物图像检测中的平均结果为0.98 mAP,在动物视频分类中的平均准确率为88%;单阶段模型YOLOv5m的识别准确率最高。该研究证明,在人工智能技术的帮助下,生态学家可以快速、高效地从大量图像中提取信息,节省大量时间,真正帮助生态学家更有效地开展野生动物保护、管理和研究工作。


622432d289504b082914d75aa2371dc.png

图1 NTLNP数据集物种图例


ac9ced4c7e180f775fddb59f4e47423.png

图2 YOLOv5模型结构图示


0803f3cf783b1c35457201a9de6844b.png

图3 FCOS模型结构图示


40ec1c9684dcf6438fd19de9ef29456.png

图4 Cascade R-CNN模型结构图示


12b45c3305d9be43af721d67a8d71b2.png

表1 NTLNP 数据集各类别训练集和测试集数量


3a45cbda77e269a551ab3a847b88c08.png

图5 昼夜联合训练下的三种目标检测模型各物种的识别准确率


东北虎豹多样性
国家野外科学观测研究站

版权所有 联系地址:北京市海淀区新街口外大街19号 北京师范大学东北虎豹生物多样性国家野外科学观测研究站     邮编100875