目标检测算法 【泡泡一分钟】多尺度优化的CNN目标检测算法(ICCV2017-55)

标题:有线电视新闻网目标检测的递归尺度近似
播音员:朱颖
编:严(60)
欢迎个人转发朋友圈;如果其他机构或自媒体需要转载,在后台留言申请授权
【目标检测算法 【泡泡一分钟】多尺度优化的CNN目标检测算法(ICCV2017-55)】抽象的
CNN神经网络本来就不适合处理大规模数据。这意味着在需要处理尺度变化的目标检测中,需要在每个尺度上计算特征图,这无疑增加了计算量,是当前实际目标检测中的一个瓶颈。
针对这一问题,本文提出了一种通用的尺度估计模型RSA,用于一次性计算特征地图,并利用这些地图来估计其他尺度上的特征地图。RSA模型的核心在于递归扩展机制,即利用两倍于当前比例尺的特征图来估计当前特征图。
同时,为了提高RSA的精度和效率,本文:(1)设计了一个尺度预测网络,使得只需要计算必要的尺度特征图;(2)提出了关键点回溯网络LRN来评价特征图上预测的关键点的可信度。LRN是一个非常有效的机制,可以大大消除RSA产生的累积误差。
最后,本文的模型也是一个端到端的系统,可以在CNN的框架下进行训练。实验表明,本文提出的算法在人脸检测中能够取得最好的效果,在一些一般场景下也能取得较好的效果。当然,最大的好处是本文的代码也是开放的,地址如下:github.com/sciencefans/RSA-for-object-detection.

目标检测算法 【泡泡一分钟】多尺度优化的CNN目标检测算法(ICCV2017-55)


文章图片

图1是本文算法的基本流程,展示了如何解决本文的多尺度检测问题。一方面,预测待检测的尺度,另一方面,使用已知的尺度特征图来估计未知的特征图。

目标检测算法 【泡泡一分钟】多尺度优化的CNN目标检测算法(ICCV2017-55)


文章图片

图2展示了LRN算法的作用,即在不同尺度上评价关键点的可信度。
摘要
由于卷积神经网络缺乏处理大规模变化的内在机制,在多尺度目标检测中,我们总是需要多次计算特征映射,这在实践中存在计算成本的瓶颈。为了解决这个问题,我们设计了一个递归比例近似(RSA)来计算一次特征地图,只有通过这个地图,我们才能近似其他级别的地图。RSA的核心是递归展开机制:给定一个特定比例的初始地图,它生成一个较小比例的预测,该比例是输入大小的一半。
为了进一步提高效率和准确性,我们(a):设计一个比例预测网络来全局预测图像中的潜在比例,因为不需要计算金字塔所有级别的地图。(b)提出一个地标回溯网络(LRN)来回溯回归地标的位置,并为每个地标生成一个置信度得分;LRN可以有效地减轻由于RSA中累积的错误而导致的误报。整个系统可以在一个统一的CNN框架内进行端到端的训练。实验表明,我们提出的算法在人脸检测基准上优于现有技术,在通用建议生成方面也取得了相当的结果。我们系统的源代码是有的。
泡泡机器人SLAM的原创内容是泡泡机器人的成员花了很大力气做出来的。希望大家珍惜我们的劳动成果。请注明来源于【泡泡机器人SLAM】微信微信官方账号,否则追究侵权!同时,我们也欢迎大家转载到自己的朋友圈,让更多的人进入SLAM领域,让我们一起为推动SLAM在中国的事业而努力!
如需业务合作和转载,请联系liufuqiang_robot@hotmail.com

    推荐阅读