复杂森林场景下野生鸟类AI识别技术评估
作者:东北虎豹多样性国家野外科学观测研究站
作者:宋奇 (第一作者),管宇 (第一作者),郭曦,郭新慧,陈昱峰,王红芳,葛剑平,王天明 (通讯作者),鲍蕾 (通讯作者)
2024年1月,东北虎豹生物多样性国家野外科学观测研究站虎豹团队在Ecological Informatics发表了研究论文“Benchmarking wild bird detection in complex forest scenes ”。该研究基于中国东北虎豹国家公园相机记录的林下15个鸟种的9717张图像数据集,测试了8种最新的AI目标检测算法(Faster RCNN、Cascade RCNN、RetinaNet、FCOS、RepPoints、ATSS、Deformable-DETR 和 Sparse RCNN)。由于生活背景的复杂程度、鸟种自身特殊保护色等原因以及目标检测算法的特点不同,这些算法对不同鸟种的检测能力存在差异。研究发现Cascade RCNN模型表现最好,模型能力mAP为0.693。此外,本研究还探讨了不同主干网对模型准确性的影响。基于Swin-T主干的Cascade RCNN是性能最佳的组合,mAP为0.704。这项研究可以帮助研究人员有效地识别鸟类,并为复杂生态环境中野生动物识别的研究提供新思路。
鸟类对陆地生态系统至关重要,在传粉、种子传播和控制昆虫方面发挥着关键作用。监测和识别野生鸟类对于了解生态系统相互作用、生态系统健康和指导保护工作至关重要。作为一种不侵扰动物且持续监测工具而出现的陷阱相机,在近几十年来对动物生态学的发展做出了巨大贡献。然而,由于产生的数据量巨大,研究者手动分析成本高昂且耗时。但在近年的计算机视觉研究中,深度学习方法表现出惊人的力量,也极大地扩展了处理海量数据的实用性,尤其是在野生动物监测方面。在中国东北虎豹国家公园中红外相机对整个生态系统进行监测时,记录到了许多常见鸟类物种,但由于视频数据量大、森林环境复杂以及仅凭视觉线索难以识别物种等因素,将数据应用于研究鸟类行为和其种群动态变得尤为困难。该研究将最新的目标检测先进算法应用到森林鸟类监测中,可为未来鸟类保护新供新见解
北京师范大学人工智能学院宋奇,生命科学学院管宇博士为论文的第一作者,鲍蕾和王天明教授为通讯作者,郭曦(地理学部),郭新慧和陈昱峰(数学学院)、王红芳、葛剑平教授参与了该研究。