news 2026/4/23 17:18:33

百度ERNIE 4.5重磅发布:210亿参数MoE模型来了

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
百度ERNIE 4.5重磅发布:210亿参数MoE模型来了

百度ERNIE 4.5重磅发布:210亿参数MoE模型来了

【免费下载链接】ERNIE-4.5-21B-A3B-Base-PT项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-21B-A3B-Base-PT

百度ERNIE系列大模型迎来重要更新,最新发布的ERNIE-4.5-21B-A3B-Base-PT模型(简称ERNIE 4.5)凭借210亿总参数的混合专家(MoE)架构,在保持高效推理的同时实现了性能突破,标志着百度在大模型技术路线上的又一重要进展。

行业现状:大模型进入"效率与性能"平衡新阶段

当前大语言模型领域正经历从"参数竞赛"向"效率优化"的战略转型。随着模型规模突破万亿参数,单纯增加参数量带来的边际效益逐渐递减,而计算资源消耗却呈指数级增长。行业普遍转向混合专家(Mixture of Experts, MoE)架构,通过激活部分参数实现"以小搏大"的效果。据公开数据,采用MoE结构的模型可在相同算力条件下提升3-5倍训练效率,同时保持与同量级 dense 模型相当的性能表现,这种"智能分配计算资源"的特性已成为大模型技术演进的重要方向。

ERNIE 4.5核心技术亮点解析

ERNIE 4.5在技术架构上实现了多项创新突破,其核心优势体现在三个维度:

1. 多模态异构MoE架构:跨模态学习新范式

ERNIE 4.5采用创新的异构MoE结构,通过"模态隔离路由"机制实现文本与视觉信息的协同训练。该架构设计了64个文本专家和64个视觉专家,配合2个共享专家,使模型能同时处理语言理解、图像识别和跨模态推理任务。特别值得注意的是,百度团队引入"路由正交损失"和"多模态 token 平衡损失"技术,有效避免了单模态数据对其他模态学习的干扰,使文本和视觉能力能够相互增强而非相互抑制。这种设计使ERNIE 4.5在保持210亿总参数规模的同时,实际推理时仅激活30亿参数(约14%),大幅降低了计算资源消耗。

2. 高效训练与推理基础设施:突破算力瓶颈

为支撑大规模MoE模型的高效训练,百度开发了异构混合并行与分层负载均衡策略。通过节点内专家并行、内存高效的流水线调度、FP8混合精度训练和细粒度重计算等技术组合,ERNIE 4.5实现了卓越的训练吞吐量。在推理优化方面,团队提出"多专家并行协作"方法和"卷积码量化"算法,成功实现4位/2位无损量化,配合动态角色切换的PD解耦技术,使模型在各类硬件平台上都能保持高性能推理。这种全栈式的效率优化,使210亿参数模型具备了实际部署价值。

3. 分阶段训练与模态专项优化:平衡通用与专精

ERNIE 4.5采用三阶段训练策略:前两阶段专注文本参数训练,构建坚实的语言理解基础;第三阶段引入视觉模态参数(包括ViT图像特征提取器和跨模态适配器),实现多模态能力融合。针对不同应用场景,模型衍生出基础版和视觉语言版(VLM):基础版专注文本生成任务,支持长达131072 tokens的上下文理解;VLM版则优化图像理解能力,提供"思考模式"和"非思考模式"两种推理路径。在后训练阶段,百度团队创新性地结合监督微调(SFT)、直接偏好优化(DPO)和统一偏好优化(UPO)技术,使模型在保持通用性的同时,能快速适配特定任务需求。

行业影响:开启大模型实用化新征程

ERNIE 4.5的发布将对AI行业产生多维度影响。从技术层面看,其异构MoE架构验证了"模态专用专家"设计思路的可行性,为多模态大模型发展提供了新参考;从应用角度,210亿总参数/30亿激活参数的配置,使模型能在普通GPU服务器上实现高效部署,显著降低了企业级应用的门槛;而Apache 2.0开源许可则为学术研究和商业应用提供了灵活空间,预计将催生大量基于ERNIE 4.5的垂直领域创新。

特别值得关注的是,百度同时提供PaddlePaddle权重(-Paddle后缀)和PyTorch权重(-PT后缀)两种版本,其中Base模型已支持通过vLLM等推理框架进行高效部署。这种"技术开放+生态兼容"的策略,有望加速大模型技术在各行业的落地进程。

结论与前瞻:效率优先成大模型竞争新焦点

ERNIE 4.5的推出,彰显了百度在大模型领域"追求极致效率"的技术路线。随着21B-A3B模型的开源释放,开发者可直接体验MoE架构带来的性能提升。未来,随着多模态能力的进一步强化和行业解决方案的深化,ERNIE 4.5有望在智能客服、内容创作、教育培训等领域发挥重要作用,推动AI技术从"可用"向"好用"的跨越。对于行业而言,百度的技术实践再次证明,大模型的竞争已从单纯的规模比拼,进入到算法创新、架构优化与工程实现的综合实力较量新阶段。

【免费下载链接】ERNIE-4.5-21B-A3B-Base-PT项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-21B-A3B-Base-PT

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 5:43:12

PlayCover完全指南:在M1/M2 Mac上运行iOS应用的终极方案

PlayCover完全指南:在M1/M2 Mac上运行iOS应用的终极方案 【免费下载链接】PlayCover Community fork of PlayCover 项目地址: https://gitcode.com/gh_mirrors/pl/PlayCover 还在为Mac无法畅玩热门手游而烦恼吗?PlayCover作为专为Apple Silicon芯…

作者头像 李华
网站建设 2026/4/23 9:20:16

屏幕翻译神器:打破语言障碍的智能助手

屏幕翻译神器:打破语言障碍的智能助手 【免费下载链接】Translumo Advanced real-time screen translator for games, hardcoded subtitles in videos, static text and etc. 项目地址: https://gitcode.com/gh_mirrors/tr/Translumo 在全球化交流日益频繁的…

作者头像 李华
网站建设 2026/4/23 10:48:35

Windows 11 LTSC系统微软商店完整部署终极指南

Windows 11 LTSC系统微软商店完整部署终极指南 【免费下载链接】LTSC-Add-MicrosoftStore Add Windows Store to Windows 11 24H2 LTSC 项目地址: https://gitcode.com/gh_mirrors/ltscad/LTSC-Add-MicrosoftStore Windows 11 LTSC系统作为企业级稳定版本,在…

作者头像 李华
网站建设 2026/4/23 12:16:20

VRCT终极教程:5分钟掌握VRChat跨语言交流神器

VRCT终极教程:5分钟掌握VRChat跨语言交流神器 【免费下载链接】VRCT VRCT(VRChat Chatbox Translator & Transcription) 项目地址: https://gitcode.com/gh_mirrors/vr/VRCT 在全球化社交时代,VRChat作为领先的虚拟现实社交平台,汇…

作者头像 李华
网站建设 2026/4/23 12:25:53

IronyModManager终极指南:从零开始掌握Paradox游戏模组管理

IronyModManager终极指南:从零开始掌握Paradox游戏模组管理 【免费下载链接】IronyModManager Mod Manager for Paradox Games. Official Discord: https://discord.gg/t9JmY8KFrV 项目地址: https://gitcode.com/gh_mirrors/ir/IronyModManager IronyModMan…

作者头像 李华