「CV」 目标检测:FPN
1 背景
FPN 就是编解码结构在目标检测中的应用,最早是在图像分割和生成式网络(AE,GAN等)中使用;目的即是为了获取更丰富的特征信息;
本文包括旷视 ThunderNet 中 CME对特征的处理;Libra R-CNN 针对feature level imbalance的处理; HRNet 特征的保留;最终介绍goole最新设计的基于 AutoML 设计的 NAS-FPN;
目标检测处理多尺度问题的策略:
策略 | 输入图片个数 | 预测使用的特征图间操作 | 预测使用的特征图个数 |
---|---|---|---|
单尺度预测 | 1 | - | 1 |
特征金字塔层 | 1 | - | n |
图像金字塔 | n | - | n |
FPN | 1 | 上采样后,与上层特征融合 | n |
判断用哪个层作为预测层: \(level = \min (5, \max(2, 4+ \log_2(\frac {\sqrt {w*h}} {224 / \sqrt {image_{area}}})))\)1
2 改进 FPN
PANet2:向下一次特征融合,再向上一次特征融合;自适应 ROI |
ThunderNet3:CEM:特征融合,单层预测,减少了计算量 |
Libra R-CNN4:融合成一个,经过休整,在反射回去,然后再融合; |
HRNet5:始终有最高分辨率下采样参与融合; |
NAS-FPN6:随机选两个进行融合,到新的尺寸 |
|
附录
A 推荐资料
- 陈泰红. 目标检测算法综述之FPN优化篇[EB/OL]. https://zhuanlan.zhihu.com/p/62975854. 2019-04-19/2021-01-11.
B 参考资料
-
T.-Y. Lin, P. Dollar, R. B. Girshick, K. He, B. Hariharan, and S. J. Belongie. Feature pyramid networks for object detection. In CVPR, 2017. ↩
-
Shu Liu, Lu Qi, Haifang Qin, Jianping Shi, Jiaya Jia. Path Aggregation Network for Instance Segmentation. IN CVPR 2018. ↩
-
Zheng Qin, Zeming , Zhaoning Zhang, Yiping Bao, Gang Yu, Yuxing Peng, Jian Sun .ThunderNet: Towards Real-time Generic Object Detection. In CVPR, 2019. ↩
-
Jiangmiao Pangy Kai Chenx Jianping Shi. Libra R-CNN: Towards Balanced Learning for Object http://Detection.In CVPR, 2019. ↩
-
K. Sun, B. Xiao, D. Liu, and J. Wang. Deep high-resolution representation learning for human pose estimation. In CVPR, 2019. ↩
-
Golnaz Ghaisi ,Tsung-Yi Lin Ruoming, Pang Quoc V. Le.NAS-FPN: Learning Scalable Feature Pyramid Architecture for Object Detection. arXiv preprint arXiv:1904.07392, 2019. ↩
Comments