涂志刚课题组在人工智能顶刊IEEE TPAMI发表运动重定向成果-测绘遥感信息工程全国重点实验室

首页 >> 新闻资讯 >> 正文

涂志刚课题组在人工智能顶刊IEEE TPAMI发表运动重定向成果

2024-05-09

分享：
阅读：

近日，我室涂志刚研究员课题组在国际人工智能领域顶级期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》(IEEE TPAMI, 影响因子23.6) 发表题为“A Modular Neural Motion Retargeting System Decoupling Skeleton and Shape Perception”的学术论文。

论文的第一作者为实验室博士研究生张嘉旭，通讯作者为涂志刚研究员。武汉大学计算机学院杜博教授，美国纽约Buffalo大学Junsong Yuan教授为论文共同作者。

课题组创新性地提出了一种用于蒙皮角色的模块化神经网络运动重定向系统（M-R2ET），实现了模块化解耦的跨骨骼结构动作映射、动作语义与角色身体形状感知。M-R2ET在重定向结果中有效保留了动作语义，减少了角色自身穿模，同时维持了动作的一致性与逼真性。经公开数据集Mixamo实验验证，M-R2ET超越了现有运动重定向技术，在精度与几何质量方面均达到了领先的性能。

M-R2ET系统能进行跨骨骼运动重定向、感知角色的骨骼与形状差异

研究背景

运动重定向（Motion Retargeting）是3D视觉与动画领域的一个重要的问题，它的目的是将一段源角色的运动迁移到目标角色上，同时维持运动本身的语义以及合理性。传统的运动重定向方法通常利用一些运动学的约束，对目标角色的运动进行优化。例如找到角色之间对应的骨骼进行motion copy，或是通过IK过程利用源角色骨骼结点的位置恢复出目标角色的运动，再通过后处理或是人工微调来保证运动重定向结果的质量。该过程需要一些专业的知识技能。同时，对于不同的角色，不同的运动，通常需要根据实际情况设计不同的约束条件，因此应用门槛较高。现有利用深度网络进行运动重定向的方法，通常采用数据驱动的策略，端到端地将源角色的运动映射到目标角色的骨骼结构上。但是这种全映射的策略通常难以学习，容易造成运动失真，也未充分考虑角色骨骼和形状差异所带来的动作语义丢失与穿模问题。

运动重定向M-R2ET系统架构

方法介绍

在本工作中，研究团队提出了一种新的残差运动重定向结构（M-R2ET）用于带蒙皮角色的运动重定向。该结构依赖于一个跨结构骨骼对齐模块用于匹配源角色骨骼与目标角色骨骼，以及两个神经网络运动修正（motion modification）模块来调整源运动，使源动作逐步适应目标骨架和形状。

首先，该系统利用跨结构骨骼对齐模块进行运动的初步复制。其次，利用课题组设计骨架语义感知模块（skeleton-aware module）用于保留源运动语义，设计形状感知模块（shape-aware module）用于感知目标角色的几何形状，以减少相互渗透和接触缺失。

随后，利用课题组提出的基于距离损失的驱动，使上述两个模块自主学习实现对源运动的残差运动进行修改，达到在无需后处理的情况下，在单个推理中生成合理的目标运动。为了平衡这两种运动修正，课题组进一步设计了一个平衡门（balancing gate），在两种运动修正之间进行线性插值。在公共数据集Mixamo上的大量实验表明， M-R2ET模型实现了最先进的运动重定向性能，并在保留运动语义以及减少相互渗透、接触缺失之间提供了良好的平衡。