news 2026/6/10 17:26:53

IROS‘25冠军 | X-VLA重磅开源,全面刷新机器人基准性能记录

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
IROS‘25冠军 | X-VLA重磅开源,全面刷新机器人基准性能记录

点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

3D视觉工坊很荣幸邀请到了清华大学智能产业研究院(AIR)博士三年级郑金亮,为大家着重分享相关领域的核心内容。如果您有相关内容需要分享,欢迎文末联系我们。

X-VLA: Soft-Prompted Transformer as Scalable Cross-Embodiment Vision-Language-Action Model
论文:https://arxiv.org/pdf/2510.10274
主页:https://thu-air-dream.github.io/X-VLA/
Code:https://github.com/2toinf/X-VLA
Model:https://huggingface.co/collections/2toINF/x-vla
Data:https://huggingface.co/datasets/Facebear/XVLA-Soft-Fold

直播信息

时间

2025年12月16日(周二)19:00

主题

X-VLA重磅开源,全面刷新机器人基准性能记录

直播平台

3D视觉工坊视频号

点击按钮预约直播

3D视觉工坊哔哩哔哩也将同步直播

主讲嘉宾

郑金亮
清华大学智能产业研究院(AIR)博士三年级

清华大学智能产业研究院(AIR)博士三年级。研究方向为计算机视觉与具身智能。以第一,共一作者发表ICML, NeurIPS, CVPR等多篇顶会论文,曾获ICML 2024 MFM- EAI workshop杰出论文奖,IROS2025 AGI World challenge冠军。担任NeurIPS, CVPR, ICLR, ICML等学术期刊及会议审稿人。

直播大纲

X-VLA是一种高扩展、简洁的通用视觉-语言-动作(VLA)模型,它通过为每个机器人平台引入实体特定的可学习软提示(Soft Prompts)来有效解决跨实体、异构机器人数据的学习难题。X-VLA是首个实现120min无辅助自主叠衣任务的全开源模型(公开数据、代码与参数),以仅0.9B的参数量在五大权威仿真基准上全面刷新性能纪录,同时,基于X-VLA的解决方案在IROS-AGIBOT World Challenge上大放异彩,夺得冠军。总体而言,X-VLA为具身智能领域提供了一个性能强劲、完全开源的新基线与技术范式。

  1. 背景介绍

  2. X-VLA结构设计

  3. 预训练方法

  4. 后训练方法

  5. 未来展望

参与方式

:3D视觉工坊很荣幸邀请到了清华大学智能产业研究院(AIR)博士三年级郑金亮,为大家着重分享相关领域的核心内容。如果您有相关工作需要分享,欢迎联系微信:cv3d009,请备注:宣传工作,则不予通过。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 17:22:19

大模型幻觉全攻略:从入门到精通(程序员必学)

文章详细解析了大语言模型幻觉问题的定义、成因和分类,提出了多种缓解方案。幻觉分为事实冲突、无中生有、指令误解和逻辑错误四类。解决方案包括检索增强生成(RAG)和后验幻觉检测,后者又分为白盒方案(基于模型内部状态)和黑盒方案…

作者头像 李华
网站建设 2026/6/10 17:24:11

4K@60fps 摄像头,到底要几条 MIPI CSI-2 LANE?

🎯 4K@60fps 摄像头,到底要几条 MIPI CSI-2 LANE? 别再“拍脑袋配 Lane”,带你从一行算到量产设计 🚗🔥 做摄像头、做域控、做 CDC / ADAS 的同学,大概率都被这个问题折磨过: “4K 60fps,到底 4 Lane 够不够?” 有人说够,有人说不行,还有人直接一句: “反正我…

作者头像 李华
网站建设 2026/6/10 15:44:05

替代 FTP 的国产传输系统成新宠!安全高效合规,满足关键行业需求

在信创产业全面推进与企业数字化转型深度融合的背景下,数据已成为核心生产要素,文件传输的安全性、合规性与高效性直接影响业务连续性与数据安全。传统FTP作为早期文件传输工具,存在明文传输、安全漏洞频发、缺乏合规审计能力、难以适配国产软…

作者头像 李华
网站建设 2026/6/10 12:11:49

vue基于springboot的企业员工考勤加班人事培训管理系统设计与实现可视化

目录已开发项目效果实现截图开发技术介绍系统开发工具:核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度系统测试总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式&…

作者头像 李华
网站建设 2026/6/10 13:53:13

12.15 element-plus的一些组件(上)

El-Plus的面包屑导航组件 <template><el-breadcrumb separator"/"><el-breadcrumb-item :to"{ path: / }">homepage</el-breadcrumb-item><el-breadcrumb-item><a href"/">promotion management</a>…

作者头像 李华
网站建设 2026/6/10 13:54:00

前端环境搭建,零基础入门到精通,收藏这篇就够了

前端环境搭建 一、node.js安装 1、windows上安装node.js&#xff08;npm&#xff09; cnpm(淘宝镜像)安装 2、Mac上安装node.js 先安装nvm再用nvm安装node.js 二、Mac下brew&#xff08;Homebrew&#xff09;安装 brew安装问题解决 三、vue脚手架&#xff08;vue-cli&#xf…

作者头像 李华