UCIe-3D是在UCIe 2.0规范中正式引入的一个重磅炸弹。它标志着 Chiplet 互连从“平面拼图”(2.5D)进化到了“垂直盖楼”(3D)。
简单来说,UCIe-3D 就是专门为“混合键合 (Hybrid Bonding)”设计的互连标准。
1. 为什么需要 UCIe-3D?
之前的 UCIe 1.0/1.1 主要解决的是2.5D 封装(把两个芯片平放在硅中介层上)。虽然也很近,但信号还是要跑几毫米。
而现在的3D 封装(比如 AMD 的 X3D 技术,直接把 Cache 叠在 CPU 脑袋上),信号传输距离只有几微米。
- 如果还用原来的 UCIe 标准,PHY 电路太复杂、面积太大、功耗太高,完全不划算。
- 所以,UCIe-3D 实际上是把物理层 (PHY) 做了极大的简化和瘦身。
2. UCIe-3D 的核心技术指标
| 特性 | UCIe-2.5D (标准版) | UCIe-3D (新物种) |
|---|---|---|
| 封装形式 | 平面并排 (Side-by-Side) | 垂直堆叠 (Face-to-Face / Face-to-Back) |
| 互连技术 | 微凸块 (Micro-bump) | 混合键合 (Hybrid Bonding) |
| 凸点间距 (Pitch) | 25μm ~ 55μm | < 10μm (甚至 1μm) |
| 线密度 | 几百根/mm² | 几万根/mm² |
| 物理层电路 | 需要驱动器、ESD、简单的均衡 | 几乎是直连 (反相器驱动) |
| 能效 (pJ/bit) | ~0.5 pJ/bit | < 0.1 pJ/bit(甚至忽略不计) |
3. UCIe-3D 怎么工作?
UCIe-3D 的物理层极其简单,它甚至抛弃了传统的“发送-接收”概念,更像是一个数字逻辑门。
- 极简驱动:因为距离极短(微米级),电容极小,所以不需要强大的驱动器。一个简单的 CMOS 反相器就能把信号推过去。
- 无需端接:没有长线传输的反射问题,所以不需要笨重的 50 欧姆端接电阻。
- 海量并行:因为连接点极小(<10μm),可以在指甲盖大小的地方塞进几十万个连接点。所以它不需要把速度跑得很快(比如只跑 2-4 Gbps),靠数量取胜。
4. 应用场景:这就是为 HBM 替代者准备的
UCIe-3D 的出现,为以下两种场景提供了标准化的接口:
3D DRAM (HBM 杀手):
- 以前如果你想把 DRAM 叠在 GPU 上,你得自己设计私有接口(像 Graphcore 那样)。
- 现在有了 UCIe-3D,长鑫/海力士可以生产符合 UCIe-3D 标准的 DRAM 晶圆,你买回来直接通过混合键合叠在你的 GPU 上就行。
3D Cache / NoC (片上网络):
- 把巨大的 L3 缓存或者片上网络交换机(NoC)做成一层单独的芯片,垂直叠在计算核心上,带宽几乎无限。
总结
UCIe-3D 是 Chiplet 的终极形态。
它把两颗芯片之间的距离拉近到了“几乎相当于芯片内部连线”的程度。如果说 UCIe-2.5D 是把两栋楼连起来的走廊,那 UCIe-3D 就是直接打穿楼板的电梯。