文章目录
- GaussianBev + REVFormer:3D 高斯表示 + 可逆 Transformer BEV 分割
- 一、任务
- 二、GaussianBev 原理
- 2.1 3D Gaussian Splatting 表示
- 2.2 Lift: 像素 → 3D 高斯
- 2.3 Splat: 高斯 → BEV 网格
- 三、REVFormer 原理
- 3.1 可逆 Transformer
- 3.2 逆向
- 四、模型
- 4.1 Gaussian Generator
- 4.2 REVFormer Block
- 五、结果 (nuScenes BEV Seg)
- 六、消融
- 七、调试
- 八、总结
- 代码链接与详细流程
购买即可解锁1000+YOLO优化文章,并且还有海量深度学习复现项目,价格仅需两杯奶茶的钱,每日更新
GaussianBev + REVFormer:3D 高斯表示 + 可逆 Transformer BEV 分割
一、任务
多相机输入 (6×RGB, 1600×900) ↓ CNN Backbone (ResNet-101 / VoVNet-99) ↓ 2D 图像特征 (多尺度 F2-F5) ↓ GaussianBev ├── Lift: 像素 → 3D 射线 ├── 生成 3D 高斯点 (每像素一个) │ ├── μ: 位置 (MLP: C → 3) │ ├── Σ: 协方差 (MLP: C → 6, 正定约束) │ └── w: 置信度 (MLP: C → 1, sigmoid) └── Splat: 高斯投影到 BEV 网格 (可微渲染) ↓ REVFormer Encoder × N ├── 可逆注意力 (heads=8, dim=256) ├── 可逆 FFN (dim=256, hidden=1024) └── 显存 O(L) → O(1) ↓ BEV 分割头 ↓ 输出: (H_bev × W_bev × C) 语