news 2026/4/23 15:04:23

微软推出算力高达10000TFLOPS的AI加速器Maia200, 主要用于推理, 台积电3nm制程

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
微软推出算力高达10000TFLOPS的AI加速器Maia200, 主要用于推理, 台积电3nm制程

https://blogs.microsoft.com/blog ... uilt-for-inference/

Maia 200 —— 一款突破性的推理加速器,旨在大幅改善 AI token 生成的经济性。Maia 200 是一款强大的 AI 推理引擎:它采用台积电 3nm 制程打造,配备原生 FP8/FP4 张量核心,重新设计的内存系统,拥有 216GB HBM3e(带宽达 7 TB/s) 和 272MB 片上 SRAM,并结合数据传输引擎,确保超大模型能够持续、高速且高利用率地运行。

这使得 Maia 200 成为所有超大规模云服务商中性能最强的第一方自研芯片,其 FP4 性能是第三代 Amazon Trainium 的三倍,FP8 性能也超过了谷歌第七代 TPU。同时,Maia 200 也是微软迄今部署过的最高效推理系统,其每美元性能比当前机群中最新一代硬件提升了 30%。


Maia 200 是我们异构 AI 基础设施的一部分,将服务于多个模型,包括来自 OpenAI 的最新 GPT-5.2 模型,为 Microsoft Foundry 和 Microsoft 365 Copilot 带来更优的性价比优势。微软超级智能(Superintelligence)团队将使用 Maia 200 进行合成数据生成和强化学习,以提升下一代自研模型的能力。
在合成数据流水线场景中,Maia 200 的独特设计有助于加速高质量、特定领域数据的生成与筛选,为下游训练提供更新、更有针对性的信号。

Maia 200 目前已部署在美国中部数据中心区域(爱荷华州得梅因附近),接下来将部署于美国西部 3 区域(亚利桑那州菲尼克斯附近),未来还将扩展到更多区域。Maia 200 与 Azure 实现无缝集成,我们正在预览 Maia SDK,提供一整套用于在 Maia 200 上构建和优化模型的工具。
该 SDK 包含完整能力集,包括 PyTorch 集成、Triton 编译器与优化内核库,以及对 Maia 底层编程语言的访问权限。这使开发者在需要时能够进行细粒度控制,同时也支持在异构硬件加速器之间轻松移植模型。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 13:40:30

【毕业设计】基于手机端的陕西地区特色农产品团购平台设计与实现小程序(源码+文档+远程调试,全bao定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/4/18 17:38:22

SYNBO AMA 回顾|将共识转化为 Alpha

链上金融的下一阶段2026 年 1 月 27 日,SYNBO 在 X(Twitter Space)举办了主题为 《Turning Consensus into Alpha:The Future of On-Chain Finance》 的全球线上 AMA。本次 AMA 邀请了来自不同 Web3 领域的生态伙伴与建设者&#…

作者头像 李华
网站建设 2026/4/21 14:04:12

KaiwuDB 分布式执行引擎的演进之路

V3.0 新一代架构突破------从 “集中汇总” 到 “分布式协同” KaiwuDB V2.x 版本中的分布式执行引擎传统架构采用的是"管理节点(Master Engine,即 ME)— 执行节点(TS Engine)"二级架构的集中式设计&#xf…

作者头像 李华
网站建设 2026/4/19 7:23:22

上海实验室推出AI智能体“安全卫士“:让机器人学会自我监督

这项由上海人工智能实验室领导的研究发表于2026年1月的arXiv预印本,论文编号为arXiv:2601.18491v1。有兴趣深入了解的读者可以通过该编号查询完整论文。 随着人工智能技术的飞速发展,AI智能体已经开始走进我们的日常生活。它们可以帮助我们管理邮件、预定…

作者头像 李华
网站建设 2026/4/17 22:54:40

基于SpringBoot的视频点播系统毕业设计源码

博主介绍:✌ 专注于Java,python,✌关注✌私信我✌具体的问题,我会尽力帮助你。 一、研究目的 本研究旨在设计并实现一个基于SpringBoot框架的视频点播系统,以满足现代网络环境下对视频内容高效管理和便捷访问的需求。具体研究目的如下&…

作者头像 李华