计算机视觉工坊汇总|实时性语义分割算法(全)( 二 )
链接:https://arxiv.org/pdf/1811.11254v1.pdf
- 该文章提出了一种全新的架构——ShelfNet , 利用多个编码-解码结构对 来改善网络中的信息流动 。
- 同一个残差块的两个卷积层贡献权重 , 在不影响精度的条件下 , 减少参数量;
- 在多个Benckmark上得到验证
本文插图
ShelfNet可以看作是FCNs的集合 。 一些信息流路径的例子用不同的颜色标记 。 每个路径相当于一个FCN(除了在ResNet主干中有池化层) 。 与FCN集合的等价性使ShelfNet能够用一个小的神经网络来执行精确的分割 。
本文插图
【16】LadderNet:用于医学图像分割的基于U-NET的多路径网络
《LadderNet: MULTI-PATH NETWORKS BASED ON U-NET FOR MEDICAL IMAGE SEGMENTATION》
链接:https://arxiv.org/pdf/1810.07810.pdf
模型结构:
本文插图
1、3是编码器分支 , 2、4是解码器分支 , A-E是不同级的特征 。 整个模型没有使用池化层 , 用的是一个步长为2的卷积层代替 , 通道数在编码器部分逐级翻倍 。
可以看出这是两个U-Net相连 , 有两个U形(12, 34) , 而这两个U形之间的A-D级采用跳接连接起来 。 U-Net网络是 , 跳接用的是融合 , 也就是通道数相加 , 但是这里用的直接求和的模式(要求通道数必须一样) 。
但增加更多的encoder-decoder分支会导致参数增加 , 训练变得困难 , 所以作者又采用了Shared-weights residual block(参数共享残差块) , 如下图所示 。
本文插图
【17】ShuffleSeg实时语义分割网络
《SHUFFLESEG: REAL-TIME SEMANTIC SEGMENTATION NETWORK》
链接:https://arxiv.org/pdf/1803.03816.pdf
嗯 。。。 这篇文章没深刻说的 哈哈
该架构将分成两个主要模块进行解释:负责提取特征的编码模块 , 负责在网络中进行上采样以计算最终类别的概率图的解码模块 。
本文插图
1)基于ShuffleNet (Shufflenet: An extremely efficient convolutional neural network for mobile devices) 提出的分割网络
2)编码器使用ShuffleNet 单元 , 解码器综合了 UNet、FCN8s 和 Dilation Frontend 的结构;速度快 , 没有什么创新 。。。。
【18】RTSeg:实时语义分割比较研究
《RTSeg: REAL-TIME SEMANTIC SEGMENTATION COMPARATIVE STUDY》
链接:https://arxiv.org/pdf/1803.02758.pdf
提供特征提取和解码方法 , 称为元架构;
给出了计算精度和计算效率之间的权衡;
Shufflenet比segment减少了143x gflops;
模型结构:
本文插图
本文插图
使用空洞卷积代替下采样的feature map , 空洞卷积确保网络维持足够的感受野而不需要通过pooling和stride conv来破坏像素结构;
Meta-Architectures
1)SkipNet meta-architecture;
2)U-Net meta-architecture;
3)Dilation Frontend meta-architecture;
- 数评时代 S7e开箱:高色域AMOLED屏与轻薄机身,视觉手感双提升,vivo
- 计算机视觉工坊 汇总|基于激光雷达的3D目标检测开源项目&数据集
- 计算机视觉工坊汇总|基于激光雷达的3D目标检测开源项目&数据集
- 亮哥说科技 你说了算原子随身听:打造专属于自己的音乐小世界交互池:让生活方式更加便捷行为壁纸:带来视觉上美的享受写在最后,VIVO自研OriginOS系统
- 北晚新视觉网 你会配合吗?网友:如实表述,2.9元买头绳收3元好评返现卡
- 成都西凡视觉|婚纱摄影|拍婚纱照选礼服攻略 婚纱照3套衣服怎么选
- 成都西凡视觉|婚纱摄影|拍婚纱照前准备事项 拍婚纱照要注意什么事项
- 成都西凡视觉|婚纱摄影|适合公布婚纱照发朋友圈的句子
- 视觉识尚|气质女神~江疏影黑色大衣+北欧风毛衣简约精致
- 智东西寒武纪MLU & 浪潮元脑联合专场上线,详解基于寒武纪MLU的视觉增强加速与应用|直播预告