汇总|实时性语义分割算法(全)( 三 )
【21】用于自动驾驶的实时语义分割解码器的设计
《Design of Real-time Semantic Segmentation Decoder for Automated Driving》
链接:
本文是采用编码解码结构 , 编码器是独立的10层VGG 。
文章插图
使用stride 2卷积后的max-pooling来减少空间问题 , 这样就减少了超参数的数量和运行时 。 显然 , 这是为了分割精度的权衡 , 但对于检测、分类等其他任务则不是这样 。 考虑到该编码器是功能独立的 , 需要在解码器方面通过广泛学习语义特征来克服空间信息探索的差距 。
文章插图
非瓶颈层的设计如下图所示 。 它同时包含1D和3D卷积核 。 一维核主要一次从一个方向提取信息 , 三维核主要从较大的接受区域收集特征 。 之后通过不同大小的多个kernel来寻找密集的信息 , 例如3×3, 5×5和1×1 。 接下来 , 融合使用不同内核提取的特征 。 该方法有助于总结从不同接受区域收集到的语义特征 。 合成的特征再一次与输入特征融合到同一个非瓶颈层 。 在所提出的非瓶颈层中 , 多个跳转连接到特征融合块 , 这有助于处理高梯度流 , 因为在反向传播时 , 传入的梯度分布在所有路径中 。
文章插图
我们知道解码器做得更宽 , 运行时间会大幅提高 。 因此 , 定期减少特征图的数量是负担不起的 , 也超出了模型的预算 。
【22】DSNet:用于实时驾驶场景的语义分割
《DSNet: DSNet for Real-Time Driving Scene Semantic Segmentation》
链接:
DSNet是一种高效且强大的单元和非对称的编解码器架构 。 采用混合扩张卷积方案来克服网格化问题 。
DSNet详细结构如下表:
文章插图
参考ShuffleNet V2总结了轻量框架指导准则如下:
准则1:等信道宽度最小化内存访问成本(MAC)
准则2:过多的组卷积增加MAC
准则3:网络碎片化降低并行度
准则4:Element-wise操作不可忽略
DSNet单元模块:
文章插图
采用ENet的初始单元 , 使用最大池和步长2的卷积对输入进行下采样 。 深度可分卷积替换为扩张型卷积 , 以扩大接收域 , 这对语义分割至关重要 。
【23】Fast-SCNN:快速语义分割网络
《Fast-SCNN: Fast Semantic Segmentation Network》
链接:
我们知道在语义分割中较大的接受野对于学习目标类之间的复杂关联(即全局上下文)很重要 , 图像中的空间细节对于保持目标边界是必要的 , 需要特定的设计来平衡速度和准确性(而不是重新定位分类DCNNs) 。
模型框架:
文章插图
two-branch 网络 , 它在低分辨率位置使用一个较深的 branch 来捕捉环境信息 , 在高分辨率位置使用一个较浅的 branch 来学习细节信息 。 然后 , 将这二者融合起来 , 形成最终的语义分割结果 。
本文的主要贡献:
1)提出了一个实时语义分割算法 Fast-SCNN , 在高清图像上准确率为68% , 速度为123.5帧每秒;
2)调整了 skip connection , 提出了一个浅层的 learning to downsample 模块 , 可以快速而高效地通过 multi-branch 来提取低层次特征;
3)设计了low capacity Fast-SCNN , 对于small capacity网络而言 , 多训练几个 epoch的效果和在ImageNet上进行预训练是一样的 。
之前的PSPNet 中的金字塔池化模块和DeepLab中的 atrous 空间金字塔池化(ASPP)用于 encode 和利用全局信息 。 与目标检测类似 , 速度是语义分割系统设计中的一个重要因素 。 基于FCN , SegNet 引入了一个联合 encoder-decoder 模型 , 是最早的高效率分割模型之一 。 延续SegNet , ENet 也设计了 encoder-decoder, 层数较少 , 降低计算成本 。 然后 , two-branch 和 multi-branch 系统出现了 。 ICNet, ContextNet, BiSeNet, GUN 通过一个较深的 branch 在低分辨率输入上学习全局信息 , 通过一个较浅的 branch 在高分辨率图像上学习细节信息 。 但是 , SOTA 的语义分割仍具挑战 , 通常需要高性能GPU 。 受 two-branch 启发 , Fast-SCNN 加入了一个共享的浅层网络来编码细节信息 , 在低分辨率输入上高效地学习全局信息 。
文章插图
详细网络如下表:
- 手机|OPPO手机该如何截屏?四种最简单的方法已汇总!
- 实时性能和健康监测工具:Netdata 1.26.0 发布
- 史上最全Python反爬虫方案汇总
- 五种IO模型详解
- 安卓阵营|iPhone 13爆料汇总:解决致命问题,改善拍照最大弱点
- 信息|11月29日百色到全国各地拼车信息汇总...
- 类别|如何用PyTorch进行语义分割?一个教程教会你
- 大数据培训完多久能找到工作?常用5个技术网站汇总分享
- 会采用|iPhone 13和iPad9渲染图曝光,爆料大汇总,12瞬间不香了
- 亮点|华为Mate40系列亮点全汇总!最强拍照+麒麟9000,7100元起