news 2026/6/11 4:59:55

4B 参数打平千亿级大模型,明日新程端侧认知模型改写 AI 算力成本账本

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
4B 参数打平千亿级大模型,明日新程端侧认知模型改写 AI 算力成本账本

【导语:在刚过去的 WWDC 上,苹果 Siri 借 AI 重生,端侧模型成为趋势。一家中国公司明日新程将 Andrei Karpathy 提出的方向落地,其 4B 参数的新程 Alpha 模型在群体智能任务中打出千亿级大模型的效果,引发行业关注。】


Token 成本高企,大模型商业遇阻

当前,Token 成本成为 AI 大规模落地最硬的一道门槛。亚马逊员工大量使用 AI 工具,导致算力开销飙升,管理层不得不关停内部 AI 排行榜。行业正在经历第一次「Token 大撤退」,部分公司单日算力消耗已触及亿元量级。大模型能力越强、推理链越深,单次调用成本越高,GPU 成本营收比成为 AI 公司的命门指标。

4B 参数新程 Alpha,等效千亿级大模型

明日新程将 Karpathy 提出的「认知核心」概念落地,推出新程 Alpha 模型。该模型参数规模为 4B,通过对开源推理模型进行强化学习训练,将知识与认知解耦,提升泛化和抽象思考能力。在群体智能任务中,新程 Alpha 达到了与 GPT - 5.4 等千亿级大模型等效的输出质量,且算力消耗和推理速度优势显著。

明日新程团队整理了 1800 年至 2020 年跨越 220 年的人类学术论文,梳理群体智能的演化脉络,在此基础上对开源推理模型做强化学习。例如,经过训练的模型能将围棋选手的决策模式迁移到日常生活场景。

解锁三层场景空间,改写成本账本

新程 Alpha 解锁了三层递进的场景空间。第一层,提升多智能体决策质量,在 Harness 决策框架中,认知模型输出效果优于推理模型,带来多智能体协作系统决策链条整体质量的跃升。第二层,大幅缩减算力成本,4B 模型云端部署算力开销降低,还支持端侧部署,将算力成本转化为电力成本,对具身智能领域意义重大。第三层,解锁主动式场景,新程 Alpha 支持 24 小时不间断运行,成本可控,让主动式智能体成为可能。

团队实力与赛道卡位优势明显

明日新程由微软小冰创始团队创立,此前训练的开源模型 rinna 以 3.6B 参数登顶日本 Hugging Face 排行榜第一名,击败 65B 参数的 Llama。新程 Alpha 延续了其「用小参数赢大参数」的技术基因。

明日新程重仓布局 Harness 群体多智能体赛道,该赛道获得头部资本确认,OpenAI 投资 Isara 推动其估值达 6.5 亿美元。在该领域智能深度评测中,明日新程综合表现显著高于单一大模型。

编辑观点:明日新程的端侧认知模型新程 Alpha 为 AI 行业带来了新的希望,通过降低算力成本、提升决策质量和解锁新场景,有望推动 AI 产品形态的变革,群体多智能体赛道前景值得期待。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/11 4:58:53

计算机毕业设计之基于python的校友录的设计与实现

本文介绍了一款使用Django和Vue开发的校友录的设计与实现,及其设计与实现过程。根据软件工程对软件系统开发定制的规则和标准,详细的介绍了系统的分析与设计过程,并且详细的概括了系统的开发与测试过程。本文的管理系统使用了Python进行系统的…

作者头像 李华
网站建设 2026/6/11 4:57:10

Bun 比 Node.js 快 30 倍?这个 JavaScript 运行时火了

引言:JavaScript 运行时格局重塑根据 2025 年 Stack Overflow 开发者调查,全球 67.5% 的开发者使用 JavaScript,连续 13 年蝉联最流行编程语言。然而,Node.js 运行时的性能瓶颈日益凸显——启动慢、内存占用高、包管理繁琐。全球 …

作者头像 李华
网站建设 2026/6/11 4:48:51

告别数据混乱:原神抽卡记录导出工具的终极指南

告别数据混乱:原神抽卡记录导出工具的终极指南 【免费下载链接】genshin-wish-export Easily export the Genshin Impact wish record. 项目地址: https://gitcode.com/GitHub_Trending/ge/genshin-wish-export 你是否也曾为原神抽卡记录混乱而烦恼&#xff…

作者头像 李华
网站建设 2026/6/11 4:46:53

AI Agent零信任安全体系解析:核心风险、分层架构与落地全流程

2026年5月,AI企业Anthropic正式发布《Zero Trust for AI Agents》安全白皮书,聚焦AI Agent场景推出一套完整的零信任落地框架。这份文件跳出了传统大模型内容风控、提示词防护的固有范畴,直击当下企业普遍面临的难题:当AI Agent具…

作者头像 李华
网站建设 2026/6/11 4:44:51

Python内存管理的艺术:从引用计数到垃圾回收的完整指南

Python内存管理的艺术:从引用计数到垃圾回收的完整指南 【免费下载链接】cpython The Python programming language 项目地址: https://gitcode.com/GitHub_Trending/cp/cpython 你是否曾经好奇,为什么Python程序很少出现内存泄漏,却又…

作者头像 李华