news 2026/4/23 12:46:16

交互式世界建模新方案!腾讯混元发布世界模型WorldPlay,兼顾实时生成与长期几何一致性;5万条样本!Med-Banana-50K支持增删病灶双向编辑

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
交互式世界建模新方案!腾讯混元发布世界模型WorldPlay,兼顾实时生成与长期几何一致性;5万条样本!Med-Banana-50K支持增删病灶双向编辑

世界模型正驱动计算智能领域的重心逐渐从语言任务拓展至视觉与空间推理,通过构建动态三维环境的模拟能力,这些模型使智能体得以感知并与复杂场景交互,从而为具身智能、游戏开发等领域开启了新的研究与应用前景。世界模型的前沿正聚焦于实时交互式视频生成,尽管已取得显著进展,但如何同时达成实时生成的低延迟与长期几何的高一致性,仍然是该领域悬而未决的关键问题。

基于此,腾讯混元团队推出了世界模型 WorldPlay,能够实现实时、交互式的世界建模,并保持长期的几何一致性,从而有效解决了现有方法在生成速度与内存占用之间的固有权衡。该系统的实现包括三项关键技术创新:

*双重动作表示法:采用双重动作表示,实现对用户键盘与鼠标输入的稳健动作控制,确保交互响应的准确性与稳定性。

*重构上下文记忆机制:为保障长期一致性,该模型设计了一种动态重构上下文记忆模块,能够重建历史帧的上下文信息,并通过时间重构策略,保持几何关键但时间久远的帧仍可被访问,从而显著缓解记忆衰减问题。

*情境强迫(Context Forcing)蒸馏方法:研究团队提出了一种专为记忆感知模型设计的新型蒸馏方法,称之为「情境强迫」。该方法通过对齐教师模型与学生模型之间的记忆上下文,使学生模型在保持实时推理速度的同时,不丧失利用远程信息的能力,有效抑制误差偏移。

WorldPlay 能够以 24 FPS 的速率稳定生成长序列、720p 的高清流媒体视频,在多项指标上优于现有技术,并在多样化场景中展现出优秀的泛化能力。通过提供系统化的控制、记忆和提炼框架,WorldPlay 在创建实时且一致的世界模型领域迈出了关键一步。

目前,HyperAI超神经官网已上线了「HY-World 1.5: 交互式世界建模系统框架」,快来试试吧~

在线使用:https://go.hyper.ai/Dgd3Z

12 月 29 日-1 月 2 日,hyper.ai 官网更新速览:

  • 优质教程精选:3 个

  • 热门百科词条:5 条

  • 1 月截稿顶会:10 个

访问官网:hyper.ai

公共教程精选

1. HY-World 1.5: 交互式世界建模系统框架

HY-World 1.5(WorldPlay)是腾讯混元团队发布的首个具有长期几何一致性的开源实时交互世界模型。该模型通过流式视频扩散技术实现实时交互世界建模,解决了当前方法中速度与内存之间的权衡问题。

在线运行:https://go.hyper.ai/Dgd3Z



Demo 页面

2. Maya1:高真实感情感语音生成服务

Maya1 是由 Maya Research 发布的一款高保真情感文本转语音(TTS)模型,专为高质量的语音合成任务设计,具有丰富的情感表达和可控的语音风格。该模型专注于通过自然语言描述准确建模说话者的情绪状态、说话速度、语调、音色和表现力,能够生成高度逼真的语音输出,极其接近人类表达。

在线运行:https://go.hyper.ai/RmmI3

效果示例

3. RFdiffusion3:蛋白质设计模型

RFdiffusion3(RFD3)是华盛顿大学蛋白质设计研究所发布的一个模型。这一最先进的生物设计 AI 模型能够生成几乎与活细胞中任何分子相互作用的新型蛋白质,解决了长期以来令蛋白质工程师感到沮丧的研究难题。

效果示例

在线运行:https://go.hyper.ai/gv4Rz

热门百科词条精选

1. 每秒帧数 Frames Per Second (FPS)

2. 双向长短期记忆 Bi-LSTM

3. 门控注意力 Gated Attention

4. 具身导航 Embodied Navigation

5. 门控循环单元 Gated Recurrent Unit

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://go.hyper.ai/wiki

一站式追踪人工智能学术顶会:https://go.hyper.ai/event

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/19 7:54:12

深度学习毕设项目:机器学习基于python深度学习的鲜花识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/4/22 15:17:21

基于SpringBoot的旅游分享点评网系统(毕业设计项目源码+文档)

课题摘要 基于 SpringBoot 的旅游分享点评网系统,聚焦旅游出行领域 “内容真实分享、目的地精准参考、用户互动交流” 的核心需求,针对传统旅游信息平台 “内容同质化、点评可信度低、互动性弱” 的痛点,构建覆盖游客、旅游博主、平台运营者的…

作者头像 李华
网站建设 2026/4/22 19:56:40

告别手动修图!AI指令改图助力电商人,轻松搞定全场景素材需求

电商运营中,视觉素材直接影响转化,但改图痛点突出:与设计师反复沟通、排期等待耗时费力,旺季赶进度更是焦灼。AI指令改图功能完美破解困境,无需懂设计,输入指令即可精准改图,适配全电商场景。下…

作者头像 李华
网站建设 2026/4/23 11:31:28

2026 年,手把手教你用 HubSpot 创建社交媒体营销日历

新年第一步:告别临时抱佛脚,让内容规划走上正轨 元旦假期一过,2026 年就正式开始了。对于营销人来说,新的一年意味着新的 KPI,也意味着一个老问题又摆在面前:明天发什么?下周发什么?…

作者头像 李华
网站建设 2026/4/14 7:39:14

彻底解决启动问题:如何修复错误代码0xc000000e一站式教程

遇到错误代码0xc000000e可能意味着您的系统启动文件有问题,这可能导致电脑无法正常启动。本文将详细介绍错误代码0xc000000e的原因及其修复方法,帮助您快速恢复电脑正常使用。错误代码0xc000000e通常与什么系统问题相关?1.启动配置数据&#…

作者头像 李华
网站建设 2026/4/16 15:51:37

2026年香港服务器走CN2线路具有哪些优势?

2026 年香港服务器走 CN2 线路具有哪些优势?先说 CN2,CN2 线路作为中国电信的优质网络通道,通过独立路由和优先级保障,为香港服务器赋予了显著优势。1.速度优势:低延迟与高带宽的完美结合CN2线路通过优化路由跳转,大幅…

作者头像 李华