Advertisement

论文阅读:FoldingNet:Point Cloud Auto-encoder via Deep Grid Deformation

阅读量:

FoldingNet:通过深度网格变形的点云自动编码器

摘要

在专门处理包括分类和分割等监督学习任务的应用中

FoldingNet的主要贡献:

该训练过程直接利用无序点云数据开发了端到端深度自动编码器。研究团队开发了一种称为折叠的新解码操作,并从理论上证明了其在点云重构中的通用性;此外这一创新解码操作不仅实现了对点云重构的一般性支持,并且能够单独输出重建点的指令信号给其他相关技术应用使用。

在这里插入图片描述

此处展示的是FoldingNet架构图。该网络借助于基于图结构的信息提取模块,在局部区域捕获点云特征。确实如此,在这里指的是KNNE(K-最近邻图)。在KCNet这篇论文中我也看到了KNNE相关讨论。关于KNNE的工作原理及应用细节,请参考FoldingNet官方的技术文档。

然而,在图卷积运算的定义上存在诸多挑战。为此,我们设计了一种基于图神经网络的简单架构。与以往研究不同的是,在本研究中我们构建了K-最近邻图(KNNG),并在每个节点及其邻域上执行最大池化操作。该方法扩展了文献[41]中所提出的局部最大池概念,并通过在多个领域中的应用展现了其有效性。相较于传统的基于卷积神经网络的方法而言,我们的设计不仅简化了架构,并且显著提升了计算效率[41]。值得注意的是,在无深度学习框架的应用场景下(如点云处理),K-NNG同样展现出其有效性,并在多个实际应用案例中取得了令人满意的实验结果[20,50,51]。

该段落涉及的是我们在文献中所熟知的一种网络架构——PointNet。类似地,在之前的阅读中我也对其有了一定了解。KNNG作为一种用于提取点云局部特征的技术相对熟悉。对于仅限于实现点云物体识别等基础任务而言,在这种情况下我们通常会采用自编码器(AE)提取潜在表示后再进行聚类分析——这也是文中始终强调的关键技术路线之一。从FoldingNet自编码器生成的结果来看其潜在表示经T-SNE聚类展示的效果如图所示。

在这里插入图片描述

有一点让我感到疑惑的是文中提到了**Transfer Classification Accuracy(转移分类准确率)**这一指标及其相关描述的具体内容。具体而言,在本节中我们将详细阐述FoldingNet在表示学习与三维点云特征提取方面的性能表现。具体来说我们按照参考文献[1,56]的方法在ModelNet数据集[57]上训练了一个线性SVM分类器[57]利用自编码器提取出的代码字(潜在表示)同时我们在ShapeNet数据集中训练了另一个自编码器。值得注意的是ModelNet数据集与参考文献[41,56]中的划分方式相同而ShapeNet数据集中的点云格式也是通过从网格模型中随机采样三角形顶点获得的。该数据集包含了来自55个不同类别的人造物体共包含57447个三维模型其中ModelNet数据集与参考文献[41]中使用的数据集具有相同的配置MN40/MN10分别包含了9843个训练模型与3991个测试模型以及2468个测试模型和909个测试模型。每个选定的数据集中都包含2048个点其(x,y,z)坐标值经过归一化处理后被映射到单位球体表面如图所示。

我目前的理解是在ShapeNet数据集上训练Autoencoder(其核心在于训练一种神经网络)来构建Autoencoder模型(AE)。经过训练后所得的AE模型以ShapeNet数据集为基础建立判别标准,在此基础上我们将其应用于ModelNet点云物体集合上获取潜在表示(latent codes),随后通过支持向量机(SVM)进行分类任务。值得注意的是,在这一过程中已经实现了对物体特性的定量分析(因为AE模型正是在ShapeNet数据集上进行学习与优化)。然而这一结论还需进一步验证与确认)。由于该判别标准建立于ShapeNet数据集的基础之上,在此基础上我们实现了跨域迁移能力(Transfer)

为了验证FoldingNet自动编码器在无监督表示学习中的有效性,我们基于[1]的研究框架,并基于ShapeNet至ModelNet的数据集迁移评估了分类精度.该自动编码器采用ShapeNet数据集进行训练,并通过从ModelNet数据集中提取代码字来进行测试.随后,我们利用一个线性SVM分类器来评估所提取代码字的区分能力.实验结果表明,ModelNet数据集上的转换分类准确率达到88.4%,涵盖40个不同形状类别.值得注意的是,该分类性能接近最先进的监督学习方法[41].为了实现最佳的分类性能与最小化重建损失的目标,我们采用了不同于[41]的人工图结构编码器.该图结构编码器以局部特征池操作为基础,并通过沿图形结构检索与传播局部结构信息来提升性能.

至于为什么选择使用Transfer Classification Accuracy指标呢?我也不太清楚。或许这是因为无监督学习方法与qiPointNet等监督学习方法之间存在显著差异吧?回想起来,在整理ModelNet数据集时,我也发现了许多其他关于点云处理的无监督学习方法。以后读到相关论文后, 我会进一步对比分析。

这篇文章相当不错仍然值得期待;其中还有其他值得探讨的问题需要进一步研究和解决。或许未来还会持续补充和完善现有的内容体系;我们鼓励大家积极参与讨论与交流,在共同进步中不断成长。

全部评论 (0)

还没有任何评论哟~