1 minute read

目标检测资源目标检测概述
本文主要关注目标检测中的多尺度优化问题,介绍 FPN 及其变体;

1 背景

FPN 就是编解码结构在目标检测中的应用,最早是在图像分割和生成式网络(AE,GAN等)中使用;目的即是为了获取更丰富的特征信息;
本文包括旷视 ThunderNet 中 CME对特征的处理;Libra R-CNN 针对feature level imbalance的处理; HRNet 特征的保留;最终介绍goole最新设计的基于 AutoML 设计的 NAS-FPN;

目标检测处理多尺度问题的策略:

策略 输入图片个数 预测使用的特征图间操作 预测使用的特征图个数
单尺度预测 1 - 1
特征金字塔层 1 - n
图像金字塔 n - n
FPN 1 上采样后,与上层特征融合 n

判断用哪个层作为预测层: \(level = \min (5, \max(2, 4+ \log_2(\frac {\sqrt {w*h}} {224 / \sqrt {image_{area}}})))\)1

2 改进 FPN

   

PANet2:向下一次特征融合,再向上一次特征融合;自适应 ROI

ThunderNet3:CEM:特征融合,单层预测,减少了计算量

Libra R-CNN4:融合成一个,经过休整,在反射回去,然后再融合;


HRNet5:始终有最高分辨率下采样参与融合;


NAS-FPN6:随机选两个进行融合,到新的尺寸
 
   
   

TOP

附录

A 推荐资料

  1. 陈泰红. 目标检测算法综述之FPN优化篇[EB/OL]. https://zhuanlan.zhihu.com/p/62975854. 2019-04-19/2021-01-11.

B 参考资料

  1. T.-Y. Lin, P. Dollar, R. B. Girshick, K. He, B. Hariharan, and S. J. Belongie. Feature pyramid networks for object detection. In CVPR, 2017. 

  2. Shu Liu, Lu Qi, Haifang Qin, Jianping Shi, Jiaya Jia. Path Aggregation Network for Instance Segmentation. IN CVPR 2018. 

  3. Zheng Qin, Zeming , Zhaoning Zhang, Yiping Bao, Gang Yu, Yuxing Peng, Jian Sun .ThunderNet: Towards Real-time Generic Object Detection. In CVPR, 2019. 

  4. Jiangmiao Pangy Kai Chenx Jianping Shi. Libra R-CNN: Towards Balanced Learning for Object http://Detection.In CVPR, 2019. 

  5. K. Sun, B. Xiao, D. Liu, and J. Wang. Deep high-resolution representation learning for human pose estimation. In CVPR, 2019. 

  6. Golnaz Ghaisi ,Tsung-Yi Lin Ruoming, Pang Quoc V. Le.NAS-FPN: Learning Scalable Feature Pyramid Architecture for Object Detection. arXiv preprint arXiv:1904.07392, 2019. 

Comments