Advertisement

论文阅读key-net

阅读量:

这篇论文提出了一种结合手工制作和学习的手工制作CNN滤波器的浅层多尺度架构,用于关键点检测。其主要贡献包括:1)提出了一种结合手工制作和学习的CNN特征的关键点检测器;2)设计了新的多尺度损失和运算符,用于跨尺度检测和关键点排序稳定性;3)基于浅层架构的多尺度特征检测。论文详细描述了Key.Net模型的架构,包括多尺度处理、模糊和下采样因子,以及损失函数的扩展。实验结果表明,Key.Net在重复性、匹配性能和复杂性方面优于现有的关键点检测方法。

论文学习笔记

这篇文章通过标题可以看出,它主要探讨了手工设计和自动学习相结合的CNN滤波器在关键点检测中的应用

文章介绍了一种创新的关键点检测任务方法,该方法通过将手工设计的CNN滤波器与深度学习机制进行深度整合,在浅层多尺度架构中实现关键点的高效检测。

key-net模型图

该模型基于ImageNet系统性构建的数据进行训练,并在Hpatch基准测试中进行评估,以验证其性能。

对输入图像实施三个尺度级别的模糊处理,其中模糊因子和下采样因子均为1.2。随后,依次进行上采样处理,随后将各尺度特征映射进行级联连接,并将所有级联后的特征信号馈送到最终的卷积滤波器中,以生成最终的响应映射。

从这一观察可以看出,当可学习的块数量为5时,效果最为显著。每个过滤器的数量为8,每个卷积层包含8个5×5大小的滤波器。可学习的卷积层通过随机方式初始化。

手工实现的滤波器Key.Net具备弱约束利用锚定方法的优势,同时,检测器能够生成新的稳定关键点。手工实现是进行计算一阶和二阶导数。

在这里插入图片描述

该点坐标是通过IP层提取的,与Ia和Ib窗口中的实际最大坐标(NMS)之间的平方差。

文章中实现了IP层向多尺度扩展,该版本的损失函数由不同尺度水平的协变量约束损失的平均构成。M-SIP通过将多次响应映射划分为网格,每个网格的大小为Ns×Ns,并计算每个网格窗口内候选关键点的位置。

在这里插入图片描述

通过实验验证,增大窗口尺寸能够提高检测的准确性。在采用8×8至40×40的五个不同尺寸进行实验时,观察到了最佳的检测效果。

文中用到的数据集
ImageNet ILSVRC 2012 dataset、Hpatches dataset

最后的实验结果表明,ket-net在对视点变化的适应性方面表现突出,而LF-Net+HardNet在光照变化条件下也展现出良好的匹配效果。

本文的方法在重复性、匹配性能和复杂性方面优于最先进的检测器。

全部评论 (0)

还没有任何评论哟~