跳至主要內容
Pyramid Scene Parsing Network

Pyramid Scene Parsing Network

  • 原文地址:Pyramid Scene Parsing Network

  • 这是一种基于整合全局上下文信息的金字塔池化模块的网络架构,根据全局先验信息能够有效地进行图像分割。

金字塔池化

  • 在深度神经网络中,感受野的大小决定了使用上下文信息的能力。常用的池化例如全局平均池化(GAP)利用全局信息进行池化,但在复杂场景下表现并不好,作者希望能够有一个基于子区域的全局上下文信息表示,于是提出了金字塔池化的概念。

    图1. PSPNet架构

    在金字塔池化模块中,特征图先经过池化操作(使用自适应平均池化)进行下采样,再进行上采样(使用二次线性差值)得到新的特征图并与原特征图拼接。

    同时金字塔池化融合了四个比例的特征(默认是[1, 2, 3, 6])。


Xenny原创大约 2 分钟深度学习深度学习PSPNet