news 2026/6/12 10:26:16

【2025 NeurIPS】Wan-Move: Motion-controllable Video Generation via Latent Trajectory Guidance

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【2025 NeurIPS】Wan-Move: Motion-controllable Video Generation via Latent Trajectory Guidance

paper: https://arxiv.org/pdf/2512.08765
code: https://github.com/ali-vilab/Wan-Move/

文章目录

  • 核心问题
  • 核心思想
  • 方法
  • 数据集构建
  • Benchmark 方法
  • 主要贡献

核心问题

旨在解决现有运动可控视频生成方法中存在的控制粒度粗糙模型可扩展性有限的问题 。

  • 挑战性:现有的方法通常依赖额外的运动编码器(如 ControlNet),这不仅增加了模型复杂性,还可能在编码过程中导致运动信号衰减,且难以在大规模基础模型上进行高效微调 。

核心思想

关键洞察是:直接通过编辑图像条件特征来注入运动信息,而无需添加任何辅助模块

  • 动机:利用 VAE 模型的平移等变性(Translation Equivariance) 。如果第一帧的特征代表了物体外观,那么将这些特征沿轨迹传播到后续帧的对应位置,就能自然地引导模型合成符合预期运动的视频 。

方法

Wan-Move构建在 Wan-I2V-14B 基础模型之上,核心流程如下:

  • 潜在轨迹映射:首先使用点轨迹(Point Trajectories)表示运动,并将其从像素空间确定性地投影到潜在空间坐标中
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/11 21:41:15

年末冲刺期的行业图景|2025 年 12 月第 2 周 AI 与机器人圈十大要事

12月8日至14日,全球AI与机器人领域迎来技术迭代与产业融合的密集爆发期。从顶尖模型的性能突破、核心硬件的创新研发,到行业展会的思想碰撞、监管政策的体系完善,多维度动态共同勾勒出行业发展的新图景。以下为该周领域内最具影响力的十件核心…

作者头像 李华
网站建设 2026/6/10 18:55:31

IT 技术人员转型网络安全赛道,是明智选择还是盲目跟风?

2024年的年前年后对于互联网人都不是一个太平的时间,互联网大厂的“裁员潮”愈演愈烈。京东裁员横跨多个板块,比例在 10-30%。有赞两轮裁员近七成,腾讯也不例外。虽已春暖花开,大厂却仍“寒冬正至”。 互联网行业迎来寒冬&#xf…

作者头像 李华
网站建设 2026/6/12 8:06:49

虚拟同步发电机(VSG)惯量阻尼自适应控制仿真模型附simulink仿真

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室🍊个人信条:格物致知,完整Matlab代码及仿真咨询…

作者头像 李华
网站建设 2026/6/10 13:48:00

Springboot——整合Langchain4j使用RAG进行对话增强

文章目录 前言 环境与配置 依赖引入 SystemMessage 验证 最初的方式 设定进阶 RAG easy-rag 精简实现 easy-rag 标准实现 第三方向量存储 前言 在之前结合Langchain4j进行对话操作时,采取限定对话前的system消息类型,能够稍微缩小AI回答的范围。 但根据user类消息的不同,AI…

作者头像 李华