news 2026/4/27 4:02:37

AI进入Agent时代,CPU何以站上“算力C位”?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI进入Agent时代,CPU何以站上“算力C位”?

在很长一段时间内,市场始终将GPU和AI算力划上等号,然而随着AI行业步入由智能体驱动的强化学习时代,CPU正逐渐演变为算力“木桶效应”下的新短板。

最新研究显示,在完整的Agent执行链路中,工具处理相关环节在CPU上消耗的时间占端到端延迟的比例最高可达90.6%。在高并发场景下,CPU端到端延迟从2.9秒跃升至6.3秒以上。其结果揭示了在大量Agentic场景中,系统吞吐受限的并非GPU计算能力,而是CPU的核心数并发调度问题。

就在日前,GPU的超级玩家英伟达主动掏出20亿美元追加认购CoreWeave股票,并声称后者将在其平台上部署Vera CPU——一款专为“代理式推理(Agentic Reasoning)”设计,且在大规模AI工厂最具能效优势的CPU。据悉,因ARM CPU瓶颈,英伟达已计划在下一代Rubin架构中大幅提升CPU核心数,并开放NVL72机柜对x86CPU的支持。

东吴证券指出,英伟达主动提升CPU权重,等同于在系统层面确认:在长上下文与高并发Agent场景中,大内存CPU是承载海量KV Cache(键值缓存)的最优容器

与此同时,由于超大规模云服务商“扫货”,英特尔与AMD在2026全年的服务器CPU产能已基本售罄。为了应对供需极端失衡并确保后续供应稳定,两家公司均计划将服务器CPU价格上调10-15%。其中,英特尔甚至紧急将产能转向服务器端,一度导致消费电子端交付受阻。

在英特尔2025年第四季度财报电话会上,CEO陈立武表示,尽管AI时代带来了前所未有的半导体需求,但短期内,“我对未能完全满足市场需求感到遗憾”。

对话靠GPU,执行靠CPU

是什么让CPU从AI算力界的“冷板凳”上站起,成为需要被单独规划的核心资源池?国金证券等多个机构总结道,Agent对CPU需求提升主要来自三方面,即应用调度压力、高并发工具调用成为瓶颈,以及沙箱隔离抬升刚性开销

应用调度压力较好理解,当AI智能体层出不穷,服务器端整体调用频次与覆盖面显著升高,便会带来更多系统请求、数据搬运与控制流开销。

至于为何CPU负载高于GPU,在东吴证券看来,Agent时代AI由“纯对话”转向了“执行任务”,因此产生大量if/else判断,这种“分支类任务”倘若由GPU执行,会因控制流发散导致算力利用率急剧下降。与之相比,CPU的微架构却能够适应此类任务。

另据广发证券,Agent时代下,大语言模型叠加了决策编排器与多类外部工具,整体计算流程演化为“感知-规划-工具调用-再推理”的闭环结构。由于工具调用、任务调度、信息检索等关键环节均依赖CPU完成,随着Agent渗透率与工具调用密度提升,CPU作为中间调度枢纽的占用线性放大。

此外,在Agent场景下,长上下文推理会快速耗尽GPU HBM容量。为解决这一问题,业界采用KV CacheOffload技术将数据迁移至CPU内存。如此一来,CPU搭配大容量DDR5/LPDDR5承载KV Cache与部分参数,便成为了兼顾吞吐、扩展性与成本效率的主流架构选择。

从投资层面来看,招商证券表示,海外CPU巨头在国内的合作商将从这一轮CPU涨价行情中直接受益。此外,国内AI全产业链自主可控仍在不断推进,硬件端与软件端的生态适配正同步跟进,生态架构的升级将会对其中的各个环节提供性能上和产量上的双重要求,并带来明显的边际变化。

国海证券指出,超大规模数据中心已进入“升级周期”,CPU架构有较大替换需求,预计2026年服务器CPU出货量有望增长25%。服务器CPU是AI算力与数据中心升级的核心受益环节,正进入存量升级+国产替代+模型迭代三重共振周期,或将迎来价值重估机会。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 6:46:05

AI智能分析系统在值班室的应用方案

目录 引言 一、方案背景与客户需求 方案背景 客户需求 二、AI智能分析系统方案说明 系统架构 前端设备 AI Box边缘计算设备 算法部署与应用 三、实施效果与优势 实施效果 方案优势 四、结论与展望 引言 随着企业安全管理要求的提升与智能化技术的广泛应用,值班室…

作者头像 李华
网站建设 2026/4/26 19:27:49

SOC工具包v3.0:从Bug Hunter到事件响应的实用指南

SOC工具包v3.0:BugHunter的事件响应建议 作者:Alican Kiraz 阅读时间:3分钟 发布日期:2020年4月3日 分享数:271 大家好,我尊敬的同事们以及未来将成为我同事的伙伴们。在本文中,我将以我初入行…

作者头像 李华
网站建设 2026/4/25 20:27:21

【2026最新收藏版】AI大模型企业落地6大核心场景,小白程序员必看!

在2026年数字化转型进入深水区的今天,企业早已告别“信息化”的基础阶段,全力冲刺“智能化”升级。传统数字化工具多局限于流程固化、数据记录的浅层应用,难以支撑企业高效创新与降本增效的核心需求。而新一代AI大模型的迭代升级,…

作者头像 李华
网站建设 2026/4/22 15:10:07

半导电材料电阻测试仪BEST-300C

半导电材料电阻测试仪BEST-300C:高精度测量与多功能应用半导电材料电阻测试仪BEST-300C 在当今科技飞速发展的时代,半导电材料在电子、能源、通信等多个领域发挥着关键作用。从半导体芯片到太阳能电池,从导电薄膜到金属涂层,这些…

作者头像 李华
网站建设 2026/4/23 8:21:31

2026年网站建设的六大核心原则体系

网站建设是一个集战略规划、视觉传达、技术实现、内容构建与运营管理于一体的综合性系统工程。它不仅仅是创建一个在线展示页面,更是构建一个能够支持业务目标、满足用户需求、承载品牌价值的数字生态系统。现代网站已从早期的静态信息发布平台,演进为支…

作者头像 李华
网站建设 2026/4/23 8:19:55

基于PLC控制的楚雄市文鼎酒店电梯系统分析与改进

基于PLC控制的楚雄市文鼎酒店电梯系统分析与改进 第一章 绪论 楚雄市文鼎酒店作为本地中端商务酒店,其现有电梯系统采用早期继电器简易PLC混合控制模式,运行中暴露出呼梯响应慢、平层精度差、能耗高、故障频发(月均故障≥3次)、…

作者头像 李华