论文介绍
当前研究的局限性
许多现有工作直接采用多速率深度可分离膨胀卷积,从单一输入特征图中同时捕获多尺度上下文信息,以提高实时语义分割的特征提取效率。然而,由于结构设计和超参数设置不合理,这种方案可能导致多尺度上下文信息难以有效获取。
两阶段特征提取方法
为降低多尺度上下文信息获取难度,提出一种高效的多尺度特征提取方法,将原始单步操作分解为两个阶段:区域残差化-语义残差化。在该方法中,多速率深度可分离膨胀卷积被赋予更简单的特征提取角色:基于第一阶段生成的简洁区域形态特征图,在第二阶段仅需以单一目标感受野执行基于语义的形态学滤波,从而提升效率。
网络模块创新设计
通过系统设计各网络阶段的膨胀率和膨胀卷积容量,充分利用所有可获得的区域形态特征图。据此分别设计两种新型模块:面向高层网络的膨胀残差(DWR)模块,以及面向低层网络的简易逆残差(SIR)模块,共同构建强大的DWRSeg分割网络。
实验验证结果
在Cityscapes和CamVid数据集上的大量实验表明,该方法在精度与推理速度间实现了最先进的平衡,同时具有更轻量化的优势。无需预训练或特殊训练技巧,在单张NVIDIA GTX 1080 Ti显卡上以319.5 FPS的速度取得Cityscapes测试集72.7%