news 2026/5/5 7:21:42

国内具身智能平台全景梳理

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
国内具身智能平台全景梳理

根据2025年世界人工智能大会(WAIC)的最新动态,国内具身智能平台已进入密集发布与商业化落地的关键阶段。以下是目前国内主要的具身智能平台及其核心特点:

一、通用型平台(“一脑多能”路线)

1.慧思开物(北京人形机器人创新中心)

  • 发布时间:2025年3月12日
  • 核心架构:全球首个“一脑多能、一脑多机”的通用具身智能平台,由AI大模型驱动的任务规划具身“大脑”与数据驱动的端到端技能执行具身“小脑”构成。
  • 关键能力
    • 大脑:具备自然交互、空间感知、意图理解、分层规划和错误反思能力
    • 小脑:包含具身操作和具身运控两个子平台,已具备30多种元技能(如打开、关上、拿起等),计划积累超过100种
  • 兼容性:支持机械臂、轮式机器人、人形机器人等多构型本体,首次实现单个软件系统在多类型机器人上的兼容
  • 开源策略:已开源SDK、具身大脑(VLM、世界模型)、运动控制框架、RoboMIND数据集等关键技术成果

2.Tairos“钛螺丝”(腾讯Robotics X实验室)

  • 发布时间:2025年7月27日
  • 平台定位:国内首个以模块化方式提供大模型、开发工具和数据服务的具身智能软件平台,通过即插即用方式面向机器人行业开放。
  • 核心组成
    • 模型层:多模态感知模型、规划大模型、感知行动联合大模型
    • 云服务层:仿真平台、数据平台、开发工具,支持云端一键拉起模型验证
  • 应用效果:搭载Tairos的宇树G1机器人可自主走到演讲台、识别环境物体(“有一个电脑、一束花、两个麦克风”),甚至能拒绝不合理的请求
  • 合作生态:首批合作伙伴包括越疆科技、乐聚机器人、帕西尼感知科技、擎朗智能、众擎机器人科技、宇树科技等

3.悟能(商汤科技)

  • 发布时间:2025年7月27日
  • 核心引擎:以商汤具身世界模型为核心,依托商汤大装置提供端侧和云侧算力支持,能够为机器人、智能设备提供感知、视觉导航及多模态交互能力。
  • 技术亮点
    • 能生成多视角视频,确保时间一致性和空间一致性
    • 构建面向人、物、场的4D真实世界
    • 用户输入简单提示词即可自主进行位姿、动作骨架和指令生成
  • 演示案例:搭载“悟能”的人形机器人可生动讲解PPT,自动翻页、回答问题、进行阶段性小结

4.智元灵渠OS + 启元大模型(智元机器人)

  • 发布时间:2025年WAIC期间
  • 平台特点:行业首个具身智能操作系统参考框架,以“分层开源、共建共享”模式推进。
  • 启元大模型:行业首个通用具身基座模型,拥有“一脑多形”能力,可适配其他异构机器人本体
  • 发展理念:打造低门槛开发框架赋能下游伙伴,先做“样板间”,再交由合作伙伴复制
  • 产品矩阵:灵犀X2、精灵G1、远征A2和远征A2-W四大机器人产品,覆盖运动智能、作业智能和交互智能

二、垂直深耕型平台(场景专用路线)

5.JoyInside(京东)

  • 发布时间:2025年7月
  • 平台定位:附身智能品牌,将角色大模型驱动对话智能体植入机器人、AI玩具等智能硬件,驱动机器人生成与语义内容高度协调统一的动作。
  • 合作生态:与数十家机器人企业达成合作,包括Fuzozo芙崽、火火兔、元萝卜AI、众擎、云深处、魔法原子等
  • 免费策略:目前限时免费开放接入服务

6.灵掘(网易灵动)

  • 发布时间:2025年WAIC期间
  • 专注领域:全球首个专为露天矿山挖掘机装车场景打造的具身智能模型
  • 核心数据:训练数据来自真实矿山作业场景,在内蒙古某露天煤矿中,单机装车效率已达人工80%,近70%作业时间无需人为干预
  • 开源动作:开源了“灵掘”数据集和端到端训练框架“机械智心”

三、平台竞争格局分析

通用与垂直的路径博弈

当前国内具身智能平台呈现出**“通用平台”与“垂直深耕”**两条并行的技术路线:

维度

通用平台型

垂直深耕型

代表平台

Tairos、慧思开物、悟能

灵掘(矿山)、JoyInside(消费)

核心理念

一脑多能、模块化赋能

场景聚焦、数据驱动

优势

覆盖面广、降低行业门槛

落地效率高、商业闭环快

挑战

场景泛化难度大、数据需求高

市场天花板有限

大厂与初创的生态位争夺

  • 大厂策略:腾讯、商汤、京东、网易均选择不做本体、专注赋能的路线,通过平台模式为机器人硬件厂商提供软件能力。正如腾讯张正友所言:“行业不缺硬件创新,但软件能力的碎片化制约了整体升级”。
  • 初创策略:以千寻智能、梅卡曼德为代表的创业公司,前者坚持“软硬都做”,后者则专注“眼脑手”核心部件。千寻智能创始人韩峰涛认为:“具身的核心是‘软’,是AI,但客户最终买的是机器人硬件”。

当前面临的共同挑战

尽管平台百花齐放,但行业仍面临几个关键瓶颈:

  1. 多模态融合深度不足:现有模型多为语言模型嫁接视觉编码器,跨模态理解停留在表层,需向原生多模态架构升级
  2. 空间感知精度有限:动态环境中的位姿规划、4D时空一致性构建等问题尚未完全解决
  3. 数据稀缺难题:真机操作数据量远低于互联网文本数据,导致模型泛化能力受限
  4. 仿真到现实(Sim2Real)迁移困难:传统仿真工具场景单一、协作低效,需要构建云端仿真环境

四、总结:2025年的“平台之战”

从2025年WAIC来看,具身智能平台已成为产业竞争的核心战场。如果说2024年是机器人本体的“硬件爆发年”,那么2025年无疑是**“软件平台年”**——各大玩家纷纷推出各自的“大脑”方案,试图在生态位争夺中占据制高点。

对于初学者或从业者来说,理解这些平台的差异和定位至关重要:

  • 如果你是机器人硬件厂商,需要选择接入哪个平台生态
  • 如果你是算法研究者,可以关注慧思开物的开源生态或Tairos的模块化接口
  • 如果你关注垂直场景落地,网易灵掘的矿山方案和京东JoyInside的消费场景值得深入研究

这些平台的共性目标是一致的:让机器人从被动执行指令的机械体,进化为主动适应现实世界的智能生命体。而谁能率先打通“数据-训练-部署”全链条的工程化闭环,谁就能在这场竞赛中占据先机。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/5 7:14:48

HCIP-DATACOM考试通关保姆级指南:从科目选择到题库实战,一次讲透

HCIP-DATACOM考试通关保姆级指南:从科目选择到题库实战,一次讲透 第一次接触HCIP-DATACOM认证时,我和大多数初学者一样感到迷茫——面对必选与自选考试的复杂组合规则、五花八门的题目类型、以及市面上良莠不齐的备考资料,很难找到…

作者头像 李华
网站建设 2026/5/5 7:13:30

扩散模型推理加速:SenCache动态缓存技术解析

1. 项目概述:当扩散模型遇上推理加速在生成式AI领域,扩散模型(Diffusion Models)已经成为图像生成的主流架构之一。然而这类模型在推理阶段需要多次迭代计算的特点,使得其推理速度成为实际应用中的主要瓶颈。SenCache正…

作者头像 李华
网站建设 2026/5/5 7:10:28

从零构建个人ChatGPT:基于Llama与LoRA的SFT与RLHF全流程实战

1. 从零到一:构建你自己的个人ChatGPT全流程拆解想不想拥有一个像ChatGPT那样能说会道、善解人意的AI伙伴,但它只属于你,能记住你的习惯,理解你的偏好,甚至用你喜欢的风格和你聊天?这听起来像是科幻电影里的…

作者头像 李华
网站建设 2026/5/5 7:03:30

GPT-5越狱PoC项目解析:LLM安全攻防演进与红队测试框架

1. 项目概述与核心价值最近在安全研究社区里,一个名为“BirdsAreFlyingCameras/GPT-5_Jailbreak_PoC”的项目引起了不小的讨论。光看这个标题,就足以让任何对大型语言模型(LLM)安全、AI对齐以及前沿技术攻防感兴趣的人心头一紧。它…

作者头像 李华
网站建设 2026/5/5 6:59:05

Scoop 入门指南:Windows 上的轻量级包管理器

目录 Scoop 入门指南:Windows 上的轻量级包管理器(附与 Chocolatey 对比) 一、先搞懂:“Scoop” 字面意思是什么? 二、为什么选 Scoop?Windows 包管理器的优势 三、Scoop 安装步骤(Windows …

作者头像 李华
网站建设 2026/5/5 6:56:38

AElf节点交互工具包:混合架构与AI集成实践

1. 项目概述:AElf Node Skill 是什么?如果你正在 AElf 区块链上进行开发,无论是构建 DApp、调试智能合约,还是进行链上数据分析,一个绕不开的核心环节就是与节点交互。传统的交互方式,比如直接调用 RPC 接口…

作者头像 李华