Advertisement

[论文笔记] [2015] Deep Convolutional Networks on Graph-Structured Data

阅读量:

这篇论文介绍了Joan Bruna等人对Spectral Network的改进工作,主要解决了两个关键问题:将该网络扩展到大规模数据任务,并提出了一种适用于没有给定图结构任务的图估计方法。论文详细阐述了图卷积的定义及其如何通过学习谱乘子来减少参数复杂度,并提出了两种构建图的方法:无监督方式基于节点特征的距离计算(如欧氏距离或自适应扩散核),以及监督方式利用神经网络学习节点表示向量并计算距离。实验表明,在带标签的数据集上使用监督构建的图结构能够提升模型性能。然而,作者也指出了未来可能需要进一步探讨的问题,如估计误差的影响以及可学习邻接矩阵等方法的可行性。

该论文发表于2015年,并由Joan Bruna及其团队对2013年的研究工作Spectral Network[1]进行了优化和改进。研究的主要贡献在于解决了两个关键性的问题。

  1. 基于谱网络的方法扩展至大规模数据处理(large-scale, high-dimensional)任务
  2. 针对未预先设定图结构的任务,提出了一种基于图估计的方法

This work extends the concept of convolutional operations to various graph structures, enabling the analysis of complex relationships within these networks.

该文章对谱网络的定义阐述更加简洁明了

Definition 1. 设矩阵W为一个大小为N \times N的相似度矩阵,并且对应于无向图G;其图拉普拉斯矩阵L = I - D^{-1/2}WD^{-1/2}由特征向量组D = W \cdot 1所确定,并由对应的特征值\lambda_1, ..., \lambda_N构成单位正交矩阵\bm{U} = (\bm{u}_1,...,\bm{u}_N)。基于此,在输入信号x\in\mathbb{R}^{N\times C}与滤波器组\{\bm{g}_c\}_{c=1}^C的基础上定义图卷积操作为:

x *_G g := \bm{U}^\top (\bm{U} x \odot \bm{U} g)

其中\odot表示逐点乘法运算;通过该操作实现了输入信号在频域空间上的变换。
由此可知,在图上学习滤波器组等价于设计频率域上的乘子函数\{\hat{w}_c\}_{c=1}^C

x *_G g := [\bm{U}]^\top \mathrm{diag}\{\hat{\bm{w}}_c\}\bm{U} x

为了使卷积运算表现出局部性(其目的是为了减少计算量和模型规模),选择了一个平滑核\mathcal{K} \in \mathbb{R}^{N \times N_0},使得w_g = \mathcal{K} \tilde{w}_g成立。池化操作被层次聚类方法所实现。

构建图结构

构建图结构

为了解决各种实际场景中缺乏直接获取图结构的问题,在许多任务中无法直接获得明确的图结构信息。为此,在文献中提出了一种无监督学习方法和一种监督学习方法来生成这些潜在的关系网络。其中的核心目标是通过计算节点间特征之间的相似性程度来生成邻接矩阵。这种方法能够有效地反映节点间的关系强度。

Graph estimation in an unsupervised manner

这种无监督学习方式实际上是基于节点自身的属性进行分析的过程,在具体实施时主要通过计算各节点之间的欧氏距离(采用Z-score标准化)来获取相似性指标;随后并结合高斯扩散核方法(或自适应扩散技术)来确定各节点间的连接强度;其数学表达式可表示为:w(i,j) = exp^{-\frac{d(i,j)}{\alpha^2}}

基于标签的数据的图重建

在数据带有标签的情况下,在数据带有标签的情况下,在数据带有标签的情况下可以选择使用监督学习的方法来构建一个全连接神经网络模型。该模型将输入样本 X \in \mathbb{R}^{L \times N} 以及对应的标签向量 y = [y_1, y_2, ..., y_L]^T 进行训练。其中每个样本经过逐层处理后会输出特征向量,并在每一步都应用ReLU激活函数并加入Dropout正则化处理以防止过拟合现象的发生。具体而言,在第一层中提取出权重矩阵 W_1 其大小为 N \times M_1(其中 N 为输入特征维度 M₁ 为隐藏层维度)。通过计算公式:

d_{sup}(i,j) = \| W_{1,i} - W_{1,j} \|²

来衡量两个节点之间的距离关系。这里将第一层的权重矩阵 W_1 视为节点嵌入向量在此基础上进行训练得到最终的节点表示向量进而用于后续特征提取的过程类似于 Word2Vec 的词向量学习方法相较于无监督的学习方法具有更好的性能表现

作者在三个数据集中进行了实验研究,在其中一个实验中旨在预测分子活性。该数据集包含8193个样本和2796个特征指标,并且由于带有标签信息的特点,在监督学习框架下构建了相应的图结构(即每个特征被设为图中的一个节点,并通过特定方法计算其与相邻节点之间的关联程度)。随后采用GCN层与FC层进行处理,并观察到相较于仅使用全连接层的效果而言更为卓越

由于提供的文本内容过于简短(仅包含"#### 总结"),在现有信息下无法进行有效的同义改写。通常情况下,建议提供更详细的具体内容以便进行改写操作。如果需要进一步的帮助,请提供更多具体内容。

该研究工作在其主要贡献在于提出了一种在无需先验给定图结构的任务下构建图结构并结合图卷积网络进行建模的方法。然而,在这种估计方式下对后续建模可能产生的误差进行探讨仍具必要性。值得注意的是,其他研究者也曾采用类似策略进行过图结构构建的相关尝试。参考了19年IJCAI上的一篇工作 [2] ,文中提出了一个 Self-adaptive 邻接矩阵的概念:该方法通过节点嵌入向量的乘积计算节点间相似性,并单独作为图卷积层使用(无需预先给定图结构),从而端到端地学习出节点隐藏的空间依赖关系(即隐式学习潜在的图结构特征)。这种方法作为一种替代方案值得进一步探讨,在实际应用中仍需验证其可行性。

[1] Bruna J, Zaremba W, Szlam A et al. Spectral-type networks and local connectivity models on graphs[J]. arXiv preprint arXIV:1312.6203, 2013.
[2] Wu Z, Pan S et al. Graph wavenet is a method used to model complex spatiotemporal dynamics on graph structures[J]. arXIV preprint arXIV:1906.00121, 2019.

全部评论 (0)

还没有任何评论哟~