news 2026/6/26 7:23:21

集结MIT、英伟达等名校名企!FoundationMotion革新视频运动理解,开源模型竟超闭源大模型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
集结MIT、英伟达等名校名企!FoundationMotion革新视频运动理解,开源模型竟超闭源大模型

# 集结MIT、英伟达等名校名企!FoundationMotion革新视频运动理解,开源模型竟超闭源大模型

![ ](http://s1.llamafactory.online/lmlab/docs/v1.0/blog/synchronize/AutoLabeling-1.jpg)

![ ](http://s1.llamafactory.online/lmlab/docs/v1.0/blog/synchronize/AutoLabeling-2.jpg)

论文标题:*FoundationMotion: Auto-Labeling and Reasoning about Spatial Movement in Videos*

作者团队:麻省理工学院(MIT)、英伟达(NVIDIA)、密歇根大学、加州大学伯克利分校、斯坦福大学

发布时间:2025年12月11日

[👉一键直达论文](https://arxiv.org/pdf/2512.10927)

[👉Lab4AI大模型实验室论文阅读](https://www.lab4ai.cn/paper/detail?utm_source=csdn_AutoLabeling&id=96eb1de43262427fb11bde8743915e13&type=paper)

## ✨研究背景

运动理解是物理推理的基础,但现有视觉-语言模型在真实世界视频的运动分析上仍表现不足:缺乏大规模、细粒度的运动标注数据是关键限制。手动标注成本极高,且难以覆盖复杂运动场景,导致模型难以学习“物体如何运动、空间关系如何变化”的深层逻辑。

## ✨研究方法

FoundationMotion是全自动数据标注pipeline,通过“检测-跟踪-生成”三步提取视频运动信息并生成结构化数据,视频预处理裁剪片段、过滤摄像机剧烈运动视频,物体检测与跟踪含开放词汇检测、人类中心检测及时序跟踪,分别识别通用物体、聚焦人机交互、维持跨帧一致性,GPT-4o-mini将跟踪数据转为含7维度的自然语言,同时生成5类运动理解问答对,模拟运动逻辑推理需求。

## ✨研究结果

FoundationMotion Dataset含50万组“视频-描述-QA”对(46.7K视频/QA),标注密度1.671问题/秒;微调相关模型后运动理解性能显著提升,前者MotionBench提升至46.7%、AV-Car提升7.1%,后者提升至41.3%并超越闭源模型;边界框JSON提升QA质量,不同QA类型互补最优。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/24 21:22:05

传统工艺即将消失?Open-AutoGLM智能守护方案来了,90%的人还不知道

第一章:传统工艺的数字化困境与Open-AutoGLM的使命在智能制造与工业4.0浪潮席卷全球的今天,许多依赖人工经验的传统制造工艺仍停留在“黑箱”操作阶段。这些工艺流程高度依赖老师傅的手感与直觉,缺乏可量化、可复制的数据支撑,导致…

作者头像 李华
网站建设 2026/6/24 15:27:24

Open-AutoGLM应急救援实战指南(黄金72小时智能调度全解析)

第一章:Open-AutoGLM应急救援实战指南概述在面对突发性系统故障、服务中断或安全事件时,快速响应与精准决策是保障业务连续性的关键。Open-AutoGLM 作为一款基于开源大语言模型(LLM)驱动的自动化运维推理引擎,专为复杂…

作者头像 李华
网站建设 2026/6/25 1:50:22

揭秘Open-AutoGLM如何重塑碳中和数据监控:5大核心技术首次公开

第一章:Open-AutoGLM 碳中和数据监控Open-AutoGLM 是一个面向可持续发展的智能数据引擎,专为碳排放监测与环境数据分析设计。其核心能力在于通过自然语言接口驱动结构化碳数据查询,并结合自动化模型推理实现动态报告生成。该系统广泛应用于工…

作者头像 李华
网站建设 2026/6/25 16:58:54

CVE-2021-40438_ Apache HTTP Server mod_proxy 模块 SSRF漏洞

CVE-2021-40438_ Apache HTTP Server mod_proxy 模块 SSRF漏洞1. 漏洞原理mod_proxy 架构漏洞怎么发生的?2. 漏洞危害3. 漏洞修复CVSS评分:9.0 1. 漏洞原理 漏洞详细分析: https://firzen.de/building-a-poc-for-cve-2021-40438https://www…

作者头像 李华