RCNN 系列
Faster R-CNN
作者引入区域候选网络,可以同时预测每个位置的对象边界和对象性分数。 作者通过引入区域候选网络作者通过引入区域候选网络来提升目标检测的速度。区域候选网络与检测网络共享全五项卷积特征。 来提升目标检测的速度。区域候选网络与检测网络共享全五项卷积特征。
用于区域检测器的卷积特征图也可以用于生成区域候选网络的特征图。 在这些卷积特征之上,我们通过添加两个额外的卷积层来构建 RPN:一个将每个卷积映射位置编码为短(例如 256-d)特征向量, 第二个在每个卷积映射位置输出对象性k 区域提案相对于该位置的各种比例和纵横比的得分和回归界限(k = 9 是典型值)
RPN是一种全卷积网络,它们可以专门针对生成检测建议的任务进行端到端训练。 为了将 RPN 与 Fast R-CNN [5] 对象检测网络统一起来,我们提出了一种简单的训练方案, 该方案在区域提案任务的微调和对象检测的微调之间交替,同时保持提案固定。 该方案收敛速度很快,并产生一个统一的网络,其卷积特征在两个任务之间共享
区域候选网络
区域提议网络 (RPN) 将图像(任意大小)作为输入并输出一组矩形对象提议,每个矩形对象提议都有一个对象性分数。 1 我们使用全卷积网络 [14] 对此过程进行建模,我们在本文中对此进行了描述部分。 因为我们的最终目标是与 Fast R-CNN 目标检测网络 [5] 共享计算,所以我们假设两个网络共享一组公共的卷积层。 在我们的实验中,我们研究了 Zeiler 和 Fergus 模型 [23] (ZF),它有 5 个可共享的卷积层, 以及 Simonyan 和 Zisserman 模型 [19] (VGG),它有 13 个可共享的卷积层。
为了生成区域建议,我们在最后一个共享卷积层输出的卷积特征图上滑动一个小型网络。该网络完全连接到输入卷积特征图的 n × n 空间窗口 每个滑动窗口都映射到一个低维向量(ZF 为 256-d,VGG 为 512-d)。 该向量被输入两个同级全连接层——盒回归层(reg)和盒分类层(cls)。 我们在本文中使用 n = 3,注意到输入图像上的有效感受野很大(ZF 和 VGG 分别为 171 和 228 像素)。 该迷你网络在图 1(左)中的单个位置进行了说明。请注意,由于迷你网络以滑动窗口方式运行,因此全连接层在所有空间位置之间共享。 这种架构自然是通过一个 n × n 卷积层和两个同级 1 × 1 卷积层(分别用于 reg 和 cls)来实现的。 ReLU [15] 应用于 n × n 卷积层的输出。