news 2026/4/23 16:03:57

【IC】3D DRAM堆叠的互连方式

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【IC】3D DRAM堆叠的互连方式

如果要在芯片上垂直堆叠 DRAM(3D DRAM / 3D-IC),传统的 SerDes 或 DDR 物理层都太“重”了

在这种极度紧密(几微米间距)的垂直互连中,最佳选择只有两条路:UCIe-3D私有超宽并行总线

1. 首选方案:UCIe-3D (标准路线)

如果你希望你的 3D 堆叠方案具有通用性(比如你的 GPU 可以叠长鑫的 DRAM,也可以叠其他厂的),那么UCIe-3D是目前唯一的标准答案。

  • 物理层特点

    • 极高密度:专门针对Hybrid Bonding (混合键合)优化,凸点间距 (Bump Pitch) 可以做到< 10μm。这意味着每平方毫米可以有 10,000+ 个连接点。
    • 极简电路:因为距离只有几微米,几乎不需要驱动能力。发送端甚至就是一个简单的反相器 (Inverter),接收端也是。
    • 极低功耗:功耗可以低至0.1 pJ/bit以下,几乎可以忽略不计。
    • 时钟:采用同步时钟(直接把时钟信号垂直打上去),不需要 CDR,不需要训练,甚至不需要复杂的对齐。
  • 优势:生态好,未来 DRAM 厂商可能会直接卖“支持 UCIe-3D 的 DRAM 晶圆”。

2. 激进方案:私有超宽并行总线 (Proprietary Ultra-Wide Bus)

如果你是像苹果、华为、特斯拉这样自己全包圆(自己设计 GPU,自己找代工,自己定制 DRAM)的厂商,你完全可以抛弃标准,做一个极致的私有接口

  • 设计思路把 DRAM 的内部总线直接暴露给逻辑芯片

    • 普通 DRAM 内部其实有几千位宽的数据通路(比如 4096 bit),但为了通过有限的引脚传出来,不得不做并转串(Serializer)。
    • 在 3D 堆叠中,你可以直接把这 4096 根线垂直打穿连接到下方的 GPU 上。
    • 物理层纯导线。除了简单的 ESD 保护和电平转换外,几乎没有任何物理层电路。逻辑芯片直接读写 DRAM 的 Capacitor Array(电容阵列)。
  • 案例

    • Graphcore IPU的 WoW 方案就是类似的思路。
    • AMD 3D V-Cache:虽然它是 SRAM 堆叠,但原理一样。它没有用复杂的 PHY,而是直接把 L3 Cache 的数据线垂直连下来。

3. 为什么不用 DDR 或 HBM 的 PHY?

因为太浪费了

  • 面积浪费:DDR/HBM 的 PHY 包含了大量的 IO Pad、ESD 保护、驱动器、端接电阻。这些东西在 3D 堆叠中都是累赘,占用的硅片面积可能比数据线本身还大。
  • 延迟浪费:经过 PHY 就意味着要有序列化、编码、解码。对于 3D 堆叠这种“零距离”接触,最好的 PHY 就是没有 PHY(直连)。

总结建议

  • 如果为了 Workaround (短期救急)
    • 可能会采用UCIe-3D或者类 UCIe 的简化版协议。因为这样可以复用现有的 Chiplet IP,研发周期短。
  • 如果为了追求极致性能 (长期布局)
    • 会走向“无 PHY 直连”。即逻辑芯片的控制器直接驱动上层 DRAM 的存储单元,把两颗芯片当成一颗芯片来设计。这需要极强的协同设计 (Co-Design) 能力。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 11:49:05

【IC】UCIe-3D

UCIe-3D 是在 UCIe 2.0 规范中正式引入的一个重磅炸弹。它标志着 Chiplet 互连从“平面拼图”&#xff08;2.5D&#xff09;进化到了“垂直盖楼”&#xff08;3D&#xff09;。 简单来说&#xff0c;UCIe-3D 就是专门为“混合键合 (Hybrid Bonding)”设计的互连标准。 1. 为什么…

作者头像 李华
网站建设 2026/4/23 11:47:34

数字频率计设计深度剖析:测频法与测周期法对比

数字频率计设计深度剖析&#xff1a;测频法与测周期法对比从一个常见问题说起你在调试某个传感器信号时&#xff0c;发现频率读数总是跳动得厉害——明明是稳定的低频脉冲&#xff08;比如每秒几次&#xff09;&#xff0c;但用常规计数器方式测量的结果却波动超过5%。你检查了…

作者头像 李华
网站建设 2026/4/23 11:50:12

Open-AutoGLM到底有多强?实测5款机型AI响应速度对比结果惊人

第一章&#xff1a;Open-AutoGLM到底有多强&#xff1f;实测5款机型AI响应速度对比结果惊人在当前移动端大模型部署日益普及的背景下&#xff0c;Open-AutoGLM作为专为轻量化场景设计的推理引擎&#xff0c;展现出令人瞩目的性能表现。为真实评估其在不同硬件平台上的AI响应能力…

作者头像 李华
网站建设 2026/4/23 11:50:06

好写作AI:协作新模式,AI提升师生、同门间的写作沟通效率

在学术道路上&#xff0c;与导师的反复沟通、与同门的协作磨合&#xff0c;常常消耗大量精力。好写作AI创新性地引入 “AI协作模式” &#xff0c;致力于成为师生、同门间的 “智能协作中枢” &#xff0c;将模糊的反馈清晰化&#xff0c;将耗时的对齐高效化&#xff0c;让写作…

作者头像 李华
网站建设 2026/4/23 13:10:04

错过Open-AutoGLM就等于错过未来?:阿里云AI基础设施变革的十大信号

第一章&#xff1a;错过Open-AutoGLM就等于错过未来&#xff1f;在人工智能技术迅猛发展的今天&#xff0c;大语言模型的自动化能力正成为推动行业变革的核心动力。Open-AutoGLM 作为一款开源的自动代码生成与逻辑推理框架&#xff0c;融合了 GLM 架构的强大语义理解能力与自动…

作者头像 李华