目标检测算法【泡泡一分钟】多尺度优化的CNN目标检测算法(ICCV2017-55)

标题:有线电视新闻网目标检测的递归尺度近似
播音员:朱颖
编:严(60)
欢迎个人转发朋友圈；如果其他机构或自媒体需要转载，在后台留言申请授权
【目标检测算法【泡泡一分钟】多尺度优化的CNN目标检测算法(ICCV2017-55)】抽象的
CNN神经网络本来就不适合处理大规模数据。这意味着在需要处理尺度变化的目标检测中，需要在每个尺度上计算特征图，这无疑增加了计算量，是当前实际目标检测中的一个瓶颈。
针对这一问题，本文提出了一种通用的尺度估计模型RSA，用于一次性计算特征地图，并利用这些地图来估计其他尺度上的特征地图。RSA模型的核心在于递归扩展机制，即利用两倍于当前比例尺的特征图来估计当前特征图。
同时，为了提高RSA的精度和效率，本文:(1)设计了一个尺度预测网络，使得只需要计算必要的尺度特征图；(2)提出了关键点回溯网络LRN来评价特征图上预测的关键点的可信度。LRN是一个非常有效的机制，可以大大消除RSA产生的累积误差。
最后，本文的模型也是一个端到端的系统，可以在CNN的框架下进行训练。实验表明，本文提出的算法在人脸检测中能够取得最好的效果，在一些一般场景下也能取得较好的效果。当然，最大的好处是本文的代码也是开放的，地址如下:github.com/sciencefans/RSA-for-object-detection.

文章图片

图1是本文算法的基本流程，展示了如何解决本文的多尺度检测问题。一方面，预测待检测的尺度，另一方面，使用已知的尺度特征图来估计未知的特征图。

文章图片

图2展示了LRN算法的作用，即在不同尺度上评价关键点的可信度。
摘要
由于卷积神经网络缺乏处理大规模变化的内在机制，在多尺度目标检测中，我们总是需要多次计算特征映射，这在实践中存在计算成本的瓶颈。为了解决这个问题，我们设计了一个递归比例近似(RSA)来计算一次特征地图，只有通过这个地图，我们才能近似其他级别的地图。RSA的核心是递归展开机制:给定一个特定比例的初始地图，它生成一个较小比例的预测，该比例是输入大小的一半。
为了进一步提高效率和准确性，我们(a):设计一个比例预测网络来全局预测图像中的潜在比例，因为不需要计算金字塔所有级别的地图。(b)提出一个地标回溯网络(LRN)来回溯回归地标的位置，并为每个地标生成一个置信度得分；LRN可以有效地减轻由于RSA中累积的错误而导致的误报。整个系统可以在一个统一的CNN框架内进行端到端的训练。实验表明，我们提出的算法在人脸检测基准上优于现有技术，在通用建议生成方面也取得了相当的结果。我们系统的源代码是有的。
泡泡机器人SLAM的原创内容是泡泡机器人的成员花了很大力气做出来的。希望大家珍惜我们的劳动成果。请注明来源于【泡泡机器人SLAM】微信微信官方账号，否则追究侵权！同时，我们也欢迎大家转载到自己的朋友圈，让更多的人进入SLAM领域，让我们一起为推动SLAM在中国的事业而努力！
如需业务合作和转载，请联系liufuqiang_robot@hotmail.com