news 2026/4/23 14:17:03

马斯克视频生成模型首次交卷!电影级运镜+音效,免费可玩

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
马斯克视频生成模型首次交卷!电影级运镜+音效,免费可玩

xAI模型支持文生视频、图生视频,单次生成时长为10秒,分辨率720P,音频效果实现大幅提升。马斯克第一时间就转发了该消息。

xAI“迄今为止最强大的视频音频生成模型”Grok Imagine 1.0版本,正式全面上线。

模型支持文生视频、图生视频,单次生成时长为10秒,分辨率720P,音频效果实现大幅提升。马斯克第一时间就转发了该消息。

先看效果。Grok Imagine 1.0能精准捕捉用户的创意构想,比如AI版“驯龙高手”,细节丰富且画面连贯:

音频表现亮眼,角色语音情感饱满、表现力十足,还能与场景节奏完美同步。

像这只毛茸茸的白色小怪兽,玩“躲猫猫”时的互动音效与语气,生动感拉满:

它也很擅长日常趣味创作,既能让老照片动起来,也能快速围绕当日热点做梗图、短视频。

把生成的片段串一串,分分钟拼出一部小短片,请欣赏:

目前官网就能免费开玩。

xAI表示,仅在过去30天的测试期内,Grok Imagine就已生成12.45亿条视频。

视频生成&剪辑性能领先

Grok Imagine的核心能力主要分为视频生成与视频剪辑两大板块。

来看更多官方秀肌肉。

视频生成方面,Grok Imagine具备电影级运镜理解:

画面衔接丝滑不卡顿:

多主体生成表现也很抗打:

且不同主体间互动自然:

Grok Imagine能很好地遵循指令,对用户脑洞的理解相当到位:

竖屏横屏通吃,适配各平台的画面比例。

视频剪辑方面,可以在视频里加对象、删元素:

替换对象也可以。

Grok Imagine还允许用户用自己的动作表演,驱动任意角色生成对应的动画效果:

秋日、冬日、薄雾、日落、阴云,场景氛围随便切:

物体颜色、物件细节也能改:

给现有视频素材换上不同的视觉风格:

静态黑白线稿也能变鲜活动画:

另外,官方表示,Grok Imagine围绕延迟、成本控制等核心维度进行了迭代优化。

AI基准测试机构Artificial Analysis的文生视频排名显示,Grok Imagine综合排名第一,在成本、延迟两项关键指标上表现最优。

Artificial Analysis和LMArena两家机构评估结果对比如下,均显示Grok Imagine在延迟和成本上处于领先位置:

图生成视频方面,Grok Imagine同样保持了高评分+低延迟+低成本的综合优势:

在针对视频编辑能力的人工盲评基准测试中,选取IVEBench数据库作为核心测试依据,该数据库涵盖七个语义维度,能全面考察工具的视频编辑综合实力。

结果显示,Grok Imagine在整体表现、指令遵循度、效果一致性三大维度均领先。

网友脑洞大开

Grok Imagine API已发布,网友们也早就已经在官网开玩了。

有人生成了一段小机器人跳舞的视频,机器人的眼睛还会跟着一眨一眨的:

还有网友还原了汤姆追杰瑞的场面,画风逼真到让人分不清是原版动画还是AI生成:

细腻的表情动作变化,它也能处理得丝滑不生硬:

第一视角的画面同样不在话下:

你觉得效果如何?感兴趣的话可以亲自上手试试。

官网:https://grok.com/imagine

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 13:58:43

演讲回顾|Apache Pulsar 延迟消息深度剖析与混合架构演进

本文整理自 刘思楠(Denovo1998) 在 Pulsar Developer Day 2025 上的主题演讲,一起来看 Apache Pulsar 如何通过混合架构突破延迟消息的性能与功能瓶颈! 01 延迟消息的应用场景与定义 在现代分布式系统中,延迟消息是一个…

作者头像 李华
网站建设 2026/4/23 13:57:37

大规模数据处理未来之路

你好,我是程序员贵哥。 今天我要分享的内容是“大规模数据处理实战”专栏的最后一讲。 我相信通过整个专栏的系统学习,你已经掌握了大规模数据处理的基础概念与设计模式。同时,我也相信,专栏中对现实世界中常见的大规模数据处理…

作者头像 李华
网站建设 2026/4/23 10:46:54

学习笔记——Linux内核与嵌入式开发2

一、Linux启动流程详解 1.1 SD卡启动流程 1.1.1 四阶段启动过程 第一阶段:i.MX6内部ROM启动 第二阶段:SD卡中的Bootloader执行 第三阶段:内核加载与启动 第四阶段:根文件系统挂载 1.1.2 详细步骤 系统上电执行内部ROM程序 i.M…

作者头像 李华
网站建设 2026/4/18 7:38:09

RPA赋能客户服务:破解效率瓶颈,实现智能降本增效

在存量竞争加剧的当下,客户服务已成为企业留存用户、打造品牌壁垒的核心抓手。但传统客服模式深陷重复劳动繁重、跨系统协同低效、峰值响应滞后的困境,而RPA(机器人流程自动化)的落地,尤其是八爪鱼RPA的场景化适配&…

作者头像 李华
网站建设 2026/4/23 13:33:38

【网络安全】我的故事:从“门外汉”到“守门人”

我的故事:从“门外汉”到“守门人” 我曾是一个普通的理工科毕业生,专业和计算机毫不沾边。决定转行网络安全,仅仅是因为觉得它“很酷”,能像电影里的黑客一样,在键盘上敲几下就能解决问题。但现实,给了我…

作者头像 李华