首页 >> 科学研究 >> 科研动态 >> 正文

实验室在视觉场景理解领域取得新进展

2021-05-31
  • 阅读:

(通讯员:马启源)近日,国际模式识别与机器智能领域权威期刊 IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE TPAMI,IF=17.861) 在线刊发了我室GEOVISION课题组的研究工作《Unmixing Convolutional Features for Crisp Edge Detection》。该工作主要研究内容为基于卷积特征解混的精细边缘检测,第一作者宦麟茜博士生(指导老师龚健雅院士、郑先伟特聘副研究员),通讯作者郑先伟。

图像几何边缘精确识别与感知是计算机视觉、摄影测量与遥感等领域长期以来的一个经典视觉任务,在地物轮廓检测、地图制图、多视立体匹配、姿态估计与三维重建等方面具有广泛的应用。近年来,随着深度学习的推动,该任务在效率和精度方面都取得了很大的进步。然而,在不借助后处理的情况下,深度神经网络提取的结果仍然存在严重的边缘定位模糊问题。经课题组深入研究发现,该问题主要源于神经网络卷积过程中导致的特征混淆以及卷积不同阶段输出的边缘图混淆性融合。针对以上问题,研究工作提出了一种上下文感知的卷积特征解混策略,可以有效提升几何边缘检测的准确性,突破了现有深度学习框架的限制。同时,该思路也可以应用于基于卷积神经网络的各类像素级预测任务(如图像分割、多视立体匹配等)。

基于卷积特征解混的精细边缘检测效果

GEOVISION课题组长期致力于地理空间高精度三维建模与大规模在线可视化研究,主要成员为熊汉江教授、郑先伟特聘副研究员,学术指导为龚健雅院士。近年来,研究工作聚焦于室内外场景视觉理解与三维建模方向,并逐渐形成了较为完整的语义三维建模研究体系,多篇相关论文被摄影测量与遥感权威国际期刊ISPRS Journal P&RS、IJDE等在线发表,授权专利5项,软件著作权3项,研发的三维实景智慧安保系统被部署于武汉世界军运会足球赛事场馆江汉文体中心。

基于视觉的室内三维点云及语义模型重建效果

论文预览版链接:

https://ieeexplore.ieee.org/document/9442882.

该工作得到了国家自然科学基金《联合图像理解与几何推断的室内语义三维建模研究》(42071370)和重点研发计划项目课题(2018YFB0505401)的共同资助。