[CVPR2018 笔记] An Analysis of Scale Invariance in Object Detection – SNIP

论文速递 Admin ⋅ 于 2个月前 ⋅ 590 阅读

来源:CVPR 2018 论文笔记@知乎专栏
作者:Pablo


CVPR 2018 ORAL

如下图,文章主要解决网络处理不同scale图片的网络策略

file
读图中配字,理解文章针对的问题
file
图二
file
图三
如上面两个图示,三种网络的训练方式和效果一目了然。

结论是:当我们要检测小的问题的时候,在输入是大的scale的网络上预训练、在高分辨率作为输入的网络上预训练、在upsample后的图片作为输入的网路上预训练,对检测小物体有益。

第4部分讲了用了 DeformableRFCN模型

第5部分主要讨论了在不同分辨率下训练,在同样的高分辨率test的结果及其分析:
file

1,在中分辨率下训练的模型比在高分辨率下训练的模型效果差,原因很简单,因为后者训练测试的分辨率相同,但并没有拉开很大的差距,为什么呢? 因为中高scale的object被变得太大以致不能被检测到

2,作者随后在高分辨率下训练了只针对80pixel下Object检测的模型,但结果比在中分辨率下的效果差了很多,为什么呢?因为忽视中高scale的Object对训练影响非常大

3,作者又用多分辨率训练模型(MST),但仍因为过小或过大的Object影响,效果仍不理想。

Scale Normalization for Image Pyramids

第6部分,作者提出了最终的模型(=_=)

该模型的输入分辨率最低480800,最高14002000,对于训练中过大或者过小scale的Object,模型选择直接忽略,训练只针对在scale的一个范围内的Object。

后面就是训练细节和trick,详情可以翻看论文


file
△ 扫一扫关注 极市平台
每天推送最新CV干货

微信公众号: 极市平台(ID: extrememart )
每天推送最新CV干货

回复数量: 0
暂无回复~
您需要登陆以后才能留下评论!