小米开源 MiMo-V2.5 系列模型：低 token 消耗，能否取代封闭前沿模型？-深圳市維司達科技有限公司

小米开源 MiMo 模型，提供低成本选择

小米发布并开源了 MiMo-V2.5 和 MiMo-V2.5-Pro 模型，二者均遵循 MIT 许可协议，为开发者构建能执行编码和工作流自动化等长任务的 AI 智能体提供了一个潜在的低成本选择。这两款模型都支持 100 万 token 的上下文窗口。

两款模型各有侧重

MiMo-V2.5 拥有 100 万 token 的上下文窗口，并采用稀疏混合专家（MoE）设计，主要面向构建自主编码和工作流智能体的开发者。MiMo-V2.5-Pro 则专为复杂的智能体和编码任务而设计，而 MiMo-V2.5 是原生全模态模型，可处理文本、图像、视频和音频。

智能体 AI 成本压力凸显，MIT 许可协议有吸引力

当前，智能体 AI 工作负载给企业的 AI 预算带来了新压力。这些系统在规划、调用工具、编写代码和从错误中恢复时会消耗大量 token，因此成本和部署控制对开发者来说愈发重要。小米表示，通过采用 MIT 许可协议，允许商业部署、持续训练和微调，无需额外授权。Kadence International 高级副总裁 Tulika Sheel 认为，MIT 许可协议很有吸引力，“它允许企业自由修改、部署和商业化该模型，不受限制，这在如今的 AI 领域十分罕见。”

MiMo 模型测试表现出色，成本控制佳

小米在博客文章中称，在 ClawEval 测试中，MiMo-V2.5-Pro 仅使用每条轨迹约 7 万个 token，就能达到 64% 的 Pass^3 准确率，相比同等能力水平的 Claude Opus 4.6、Gemini 3.1 Pro 和 GPT-5.4，token 消耗减少了约 40 - 60%。这两款模型采用稀疏混合专家（MoE）设计来控制计算成本。参数为 3100 亿的 MiMo-V2.5 每次请求仅激活 150 亿参数，而参数为 10.2 万亿的 Pro 版本则激活 420 亿参数。小米还提到，Pro 模型的混合注意力设计在长上下文任务中可将 KV 缓存存储减少近 7 倍。

长期测试成果显著

小米列举了多项长期测试结果，例如 MiMo-V2.5-Pro 在 4.3 小时内通过 672 次工具调用完成了一个用 Rust 编写的 SysY 编译器，通过了全部 233 项隐藏测试；该模型还在 11.5 小时的自主工作中，通过 1868 次工具调用生成了一个 8192 行的桌面视频编辑器。

企业会采用 MiMo 吗？

小米的 MiMo-V2.5 系列模型能否在智能体编码和自动化工作负载方面，在企业开发者中取代封闭前沿模型，将取决于企业对性能、成本和风险的评估。Omdia 首席分析师 Lian Jye Su 表示：“企业开发者在评估小米的 MiMo-V2.5 及其变体时，应考虑总体拥有成本（TCO），包括 token 效率、每项成功任务的成本，以及与专有模型相关的许可成本。封闭前沿模型在通用任务和最具挑战性的边缘情况上可能仍具优势，但开放权重模型在大量的智能体工作中表现出色。”

MiMo 可作高性价比选择

Pareekh Consulting 首席执行官 Pareekh Jain 认为，企业不应将 MiMo-V2.5 视为 Claude 或 GPT 的替代品，而应将其作为处理高 token 工作负载的高性价比智能体模型。“关键指标不仅是准确性，还有每项成功任务的 token 消耗。前沿模型在复杂编码基准测试中往往能达到更高的成功率，但会产生大量推理开销。MiMo-V2.5 旨在提高 token 效率，意味着它能用显著更少的输入和输出 token 取得相当的结果。”Jain 指出，这使得类似 MiMo 的模型可作为重复性编码、质量保证、迁移、文档编写、测试和自动化工作负载的“经济主力”，而封闭前沿模型仍将是最难任务的质量标杆。

MiMo 或改变企业 AI 经济模式

Gartner 高级首席分析师 Ashish Banerjee 表示，像 MiMo 这样的模型可能会显著改变企业长期智能体的 AI 经济模式。“当任务涉及数百万 token 时，按使用量计费的专有 API 就不再方便，而更像是对迭代的一种负担。相比之下，MiMo 的 MIT 许可协议、开放权重、100 万 token 的上下文窗口和相对较低的价格，使私有云或自托管部署在战略上更具可行性。”不过，Banerjee 也指出，这并不意味着企业会放弃专有 API。“企业将继续使用专有 API 以获得前沿的准确性和低运营消耗，同时将大规模、可重复的智能体工作流转向开放模型，因为在这些场景中，成本可预测性、数据控制和定制化更为重要。简而言之，长期、大量的智能体 AI 将发展成一个混合市场，像 MiMo 这样的开放模型将打破对纯 API 的依赖。”

MiMo 采用或面临挑战

此外，Su 补充说，由于源自中国的模型可能会引起受监管的西方组织的担忧，MiMo 的采用可能会面临挑战。

2026届毕业生推荐的六大AI学术助手推荐榜单

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 此刻，AI论文网站已然成了学术写作里十分重要的辅助工具，这类平台一般…

李华

YOLO11性能暴增：主干网络升级 | 替换为PP-LCNet主干，Intel CPU上也能跑出GPU速度的轻量级王牌

一、引言：YOLO11凭什么成为2026年最值得关注的目标检测模型？ 2024年9月30日，Ultralytics在YOLO Vision 2024（YV24）大会上正式发布了YOLO11，标志着YOLO家族迈入全新篇章。根据Ultralytics官方发布信息，YOLO11由Glenn Jocher和Jing Qiu主导开发，在前代模型的基础上引入了…

李华

破解类风湿关节炎的分子密码：生物标志物全景与高通量检测新策略

一、引言类风湿关节炎的早期诊断与精准治疗长期面临挑战，其核心难题在于该疾病具有高度异质性。单一生物标志物难以全面反映患者体内复杂的免疫网络紊乱与组织破坏进程。随着多因子高通量检测技术的发展，研究者能够在同一份微量样本中同时捕捉数十种病理…

李华

FreeLLMAPI-免费模型聚合代理

FreeLLMAPI：聚合14+免费LLM API的OpenAI兼容代理完全指南一个代理，14+免费模型，自动故障转移，零成本AI应用开发前言在AI应用开发中，API成本是一个不可忽视的问题。即使是使用相对便宜的模型，大规模调用也会产生可观的费用。对于个人开发者、学生、开源项目来说，API成…

李华

用《人民的名义》学Word2Vec：手把手教你用Gensim计算人物相似度（附完整代码）

用《人民的名义》解锁Word2Vec：影视文本分析实战指南最近重看《人民的名义》，突然想到一个问题：如果让AI来理解剧中人物的关系，会得出什么有趣的结论？这就是我们今天要探索的主题——用Word2Vec模型分析影视剧本中的人…

李华

别再只盯着正态分布了：聊聊Gumbel分布在推荐系统和用户选择模型里的那些事儿

从Gumbel分布到Softmax：推荐系统中用户选择行为的数学本质当你在电商平台浏览商品时，那些"猜你喜欢"的推荐背后，隐藏着一套精妙的数学逻辑。不同于常见的正态分布，Gumbel分布——这个在极值理论中占据核心地位的概率分…

李华