PAnet 论文阅读笔记

news/2025/2/26 7:04:23

Path Aggregation Network for Instance Segmentation

  • 网络结构如下,在FPN的基础上加了一个bottom-up path augmention,也就是b所表示的结构,此结构缩短了从最浅层大尺度特征图到最终用于检测的小尺度特征图的距离,按FPN的结构,从最浅层大尺度特征图到结果的小尺度特征图要走红色这条线,经过很多层网络(因为走了一个resnet101或者resnet50),但是PAnet提供了绿色这条捷径,经过较少的层数。 在这里插入图片描述
  • 此外提出了一个adative feature pooling,用一个element wise的max把多层特征fusion到一起,并且探究了训练好的这个网络对不同大小的目标的特征来源的占比。这个给实验表明,小目标(原本在FPN被分配到level1的大特征图)源自level1的特征仅占0.3的比例,其它也是如此。这表明每个目标都同时需要不同层的特征图。 在这里插入图片描述

http://www.niftyadmin.cn/n/3658012.html

相关文章

ACM UVa算法题209 Triangular Vertices的解法

有一段时间没有做ACM算法题目了,今天正好有空便随便挑了209题来做做:ACM UVa算法题#209题这道题有几个要点:1. 给定坐标系坐标系很容易定,我采用的是第一个点为(0, 0)点,X方向差别为2个单位,Y方向差别为1…

EfficientDet 论文阅读笔记

EfficientDet: Scalable and Efficient Object Detection 三点,一点是可学习权重的feature fusion;一点是新的scaleing method;一点是用了efficient net的结构 feature fusion,用BiFPN的结构 ,并且用带权重的fusion方…

M2Det论文阅读笔记

M2Det: A Single-Shot Object Detector based on Multi-Level Feature PyramidNetwork 文章提出了一种“更加高效”的multi-scale detection方法来应对目标的multi-scale问题,并取得了state of art的效果:网络结构如下:个人觉得文章写得很差…

我的MSDN Blog正式开张,欢迎大家访问 [ http://blogs.msdn.com/yizhang/ ]

我的MSDN Blog创建了其实有一阵子了,但是一直没有时间添加内容。这两天写了几篇文章(新的和在CSDN Blog上面发表过的,内容比较简单)放在上面。这个Blog主要是英文的内容,主要会和我在Microsoft的所进行的CLR开发工作有关系&#x…

Visual Studio 2005的JIT Debugger在Vista上面无法正常工作

Visual Studio 2005的Jit Debugger在Vista上不工作,即使你打了SP1和Update for Windows Vista也不行。修改Jit Debugger使其工作在Vista上需要大量的修改,因此这个工作被移到Visual Studio Code Name Orcas,也就是2007中去了。不过不排除微软…

Attentive Generative Adversarial Network for Raindrop Removal from A Single Image 阅读笔记

Attentive Generative Adversarial Network for Raindrop Removalfrom A Single Image 去雨不是我的方向,读这篇论文的主要目的在于它同时用到了注意力机制和LSTM网络结构是这样的:attention的机制是这样的:生成的attention map居然是concat…

.NET / Rotor源码研究3 – 调试Rotor托管代码的利器:WinDbg和SOS

WinDbgSOS简介在动手进一步研究Rotor之前,我们需要首先解决一个问题:用什么调试工具最好? 很有可能你会说,这还不简单,直接用Visual Studio不就好了?一般情况下是的,只不过,在这个情况下&#…

Relation Networks for Object Detection 论文阅读笔记

Relation Networks for Object Detection 文章提出了一种attention机制,建模了二阶段检测的目标间的relation,并且可以替代掉nms策略从而构造一个真正的end-to-end的目标检测框架,并自称是首个(因为其他deep learning 目标检测需要…