Adaptive Graph Convolutional Recurrent Network for Traffic Forecasting
研究问题
自适应捕捉交通流时间序列中的时空依赖问题
背景动机
- 当前的大多数深度学习方法主要采用了共享参数架构(每个节点都采用相同的卷积操作)。然而由于每条道路的具体情况千差万别,这种架构难以有效捕捉细粒度的数据模式。
- 现有的方法主要依据距离或相似度来构建一个图结构以捕捉空间相关性(尽管如此),但这一过程很难完美地反映空间依赖关系。
模型思想
- 开发具有自适应能力的NAPL模块(Node Adaptive Parameter Learning),该模块将重新组织传统GCN中的参数设置。
- 通过提取各节点特征信息后将其映射到全局权重池中,并为每个节点独立分配偏置项。
- 基于上述两个关键组件以及RNN架构设计了一种新型的AGCRN模型(Adaptive Graph Convolutional Recurrent Network),该模型能够有效捕获交通序列中细粒度的空间时间关联性。
- 构建能够自适应地生成DAGG(Data Adaptive Graph Generation)的模块。
符号定义
由N个节点在不同时间点构成的时间序列数据集可表示为\mathcal{X}=\left\{\boldsymbol{X}_{:, 0}, \boldsymbol{X}_{:, 1}, \ldots, \boldsymbol{X}_{:, t}, \ldots\right\},其中每个\boldsymbol{X}_{:, t}定义为包含第t时间点上所有节点的向量\left\{x_{1, t}, x_{2, t}, \ldots, x_{i, t}, \ldots x_{N, t}\right\}^{T}属于实数空间R^{N \times 1}。我们的目标是设计并训练一个能够有效预测未来节点状态的函数模型。
该集合\left\{\boldsymbol{X}_{:, t+1}, \boldsymbol{X}_{:, t+2}, \ldots, \boldsymbol{X}_{:, t+\tau}\right\}由参数\theta下的映射\mathcal{F}生成,并基于t及其之前的连续时间步的数据点构成。
其中\mathcal{G}=(\mathcal{V}, \mathcal{E}, \boldsymbol{A})
模型结构
- 节点自适应参数学习(NAPL)模块
传统GCN的计算公式如下
Z=\left(\boldsymbol{I}_{\boldsymbol{N}}+\boldsymbol{D}^{-\frac{1}{2}} \boldsymbol{A} \boldsymbol{D}^{-\frac{1}{2}}\right) \boldsymbol{X} \boldsymbol{\Theta}+\mathbf{b}
考虑到所有节点的特征都经过共同使用的参数矩阵\Theta进行处理后实现了特征维度从C空间升至F空间的能力(注:这里的"能力"是为了增加描述性而非改变原意),我们便能够观察到这一现象的存在
Z=\left(I_{N}+D^{-\frac{1}{2}} A D^{-\frac{1}{2}}\right) X E_{\mathcal{G}} W_{\mathcal{G}}+E_{\mathcal{G}} b_{\mathcal{G}}
- 数据自适应图生成(DAGG)模块
初次 encounter 这样简单的自学习公式,
其特点在于两个相同矩阵相乘能够直接生成对称矩阵,
值得注意的是,其他研究偶尔会假设这种关系是非对称的。
\boldsymbol{D}的逆二次根矩阵与\boldsymbol{A}相乘后再与\boldsymbol{D}的逆二次根矩阵相乘的结果等于应用Softmax函数到ReLU函数作用于\boldsymbol{E}_{\boldsymbol{A}}与\boldsymbol{E}_{\boldsymbol{A}}^{\top}相乘积后的值
- 自适应图卷积递归网络(AGCRN)
重写GRU计算过程

实验部分
- 对比实验

- 消融实验

评价
这篇论文研究的主要巧妙之处在于对传统图卷积的共享参数部分采用了分解技术,并最终使得节点特异性的参数得以实现。
