近期,刘进、许妙忠、邵振峰团队研究成果《Enhancing Object Detection With Fourier Series》在国际人工智能领域顶级期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》(IEEE TPAMI)发表,论文的第一作者为刘进副教授,通讯作者为实验室鲁仲缘博士、邵振峰教授和许妙忠教授。论文提出了一种新的目标检测方法——傅里叶级数目标检测(FSD)。通过将目标的轮廓闭合曲线编码为两个一维周期傅里叶级数,构建了傅里叶级数模型(FSM)来回归每个目标的傅里叶级数,从而在推理阶段能精确恢复目标的细节轮廓信息。为确保模型学习过程不受标注轮廓点起始点顺序的影响,论文引入了滚动优化匹配傅里叶损失。当模型的每个学习样本存在多组合理真值时,选择各自损失最小的那一组进行学习,从而让模型关注问题本质进而加速训练进程。
在目标检测领域,传统方法通常通过矩形框或旋转矩形框来表示目标的轮廓,但这种方式难以精确描述形状复杂的目标。为解决这一问题,论文提出傅里叶级数目标检测。通过回归目标傅里叶系数,精确捕捉目标外轮廓信息。傅里叶级数能有效压缩形状特征信息,减少学习数据量,使得模型用固定维度傅里叶级数表示形状各异的目标轮廓,显著提高目标检测模型对复杂形状目标的描述能力。
? 
图1 傅里叶级数目标检测模型与滚动优化匹配
通过傅里叶级数展开,模型能够在推理阶段恢复出更为精细的目标轮廓,并进一步推断出目标的整体几何分布、面积和主要方向向量。相比传统的检测框,傅里叶级数模型能够更加准确地包围目标,提供更多形状信息,尤其对于复杂形状和细长目标的检测具有显著优势。研究亮点主要体现在:
??? ·提出傅里叶级数目标检测模型,能够精确恢复目标的细节轮廓信息;
·引入了滚动优化匹配傅里叶损失,提高训练效率和准确度;
·采用傅里叶功率谱分析利用傅里叶功率谱表征目标丰富的几何形状特征。
?
??




图1 论文方法检测效果图
图3左侧展示了FSD方法的效果,右侧为实例分割的结果。图中司机被像素分割模型切割成几块,而FSD通过目标级建模能得到完整围绕司机的轮廓曲线。傅里叶级数模型能输出目标曲线方程的压缩信息,适合实时场景语义分析。
? 
图3 FSD方法与实例分割的效果图
实验结果表明,FSD模型在DOTA1.5数据集上取得了73.3%的AP50,相较于经典方法有所提升;在UCAS数据集上,FSD模型的AP50达到97.25%,同样超越了现有方法。这一研究不仅提高了非矩形或长条形目标区域的特征提取能力,也为目标检测领域的进一步发展提供了新的思路。
论文全文下载链接:https://ieeexplore.ieee.org/document/10833868
成果软件视频展示:https://liujin1975060601.github.io/yolov5-ft/index.html
主要作者介绍:
刘进,武汉大学测绘遥感信息工程全国重点实验室副教授,武汉市黄鹤英才,主要研究领域为计算机视觉与机器学习。在Neural network,Neurocomputing等人工智能领域期刊发表多篇论文。主持完成国家自然科学基金2项,主持完成慧眼行动项目,湖北省重点研发计划项目。曾获2022年第十六届中国计算机博弈锦标赛冠军,2022年ICGA奥赛金牌;2020年第2届天智杯人工智能挑战赛获奖。
鲁仲缘,武汉大学测绘遥感信息工程全国重点实验室博士研究生。研究领域为遥感信息智能处理。