Advertisement

Dynamic Spatial-Temporal Graph Convolutional Neural Networks forTraffic Forecasting

阅读量:

该类深度学习模型(如图卷积神经网络)正逐步成为机器学习领域的研究热点之一。其核心机制在于利用基于节点间距离计算得到的Laplacian矩阵来描述图上各节点间的空间相关性。值得注意的是,在动态场景下或实时处理任务中(如社交网络分析或交通流量预测),若空间相关性随时间演变,则固定不变的Laplacian矩阵将难以有效建模这些时变特性。

为了追踪交通数据间的空间依赖关系

基于这两个关键组成部分完成了一个Laplace矩阵(图)理论推导过程,并阐述了相关的设计思路与依据。通过接入两个实时交通数据集进行预测性能评估的结果表明,在测试环境下该网络可实现约25%的数据处理效率提升

这篇论文探讨动态拉普拉斯矩阵的应用值得深入研究。
例如,在计算短期交通流量时,默认假设已排除长期影响。
这一假设存在明显的缺陷。
张量模型在处理多时间尺度数据时表现出较高的灵活性。
这种方法在实际应用中存在一定的局限性。
尽管这种方法在某些领域得到广泛应用,
但在模拟复杂系统的依赖关系方面仍显不足

背景:

已有研究表明,在不同时段间所呈现的交通流模式存在显著差异。
此外,在日常生活中不可避免地会遇到交通事故的情况,并由此会对路网中路段之间的相互关系产生影响。
这些因素将导致邻接矩阵呈现出动态变化特征,并由此引发拉普拉斯矩阵的变化。
因此,在实际应用中很难处理具有时变特性的精确拉普拉斯矩阵。

框架:

Dynamic Laplacian Matrix Estimator

基于一个表示交通网络静态图结构的全局Laplacian矩阵...基础上,在其周围将发生波动。扰动源于图结构发生微小变化的结果 ,主要由短期交通模式以及偶尔发生的交通事故所造成。因此仅需根据短时流量确定拉普拉斯矩阵的变化量即可。由于长期交通数据的空间与时间相关性特征,在空间维度上形成一个低秩张量 。然而,在时间维度上很少出现动态变化或异常事件,在此情况下短时数据在时间维度上形成了一个稀疏张量。

因此,在神经网络中嵌入张量操作,并将交通流量数据划分为两部分:一部分用于捕捉具有强长期相关性的交通信息(通过低秩张量表示),另一部分则用于跟踪实时变化(通过稀疏张量表示)。我们的Laplacian矩阵估计器由两部分组成:一个是基于张量分解层(TDL)的部分;另一个是用于动态更新Laplacian matrix的学习模块。

1)Tensor Decomposition Layer (这部分值得学习)

在我们的Laplacian矩阵估计器中,我们采用了TDL方法来提取交通数据中的全局与局部特征分量,并经过收缩与恢复两个步骤完成了数据处理流程.

我们展示了三阶流量张量χ及其在(p, m, c)维度上的分布情况。该研究具体涉及空间域中的节点数量、在时间维度上需要考虑的时间分段数目以及用于监测信道状态的数量。其中参数c被设定为1以聚焦于交通速度的研究。(r₁,r₂)则代表了在空间与时间维度上所观察到的数据模式特征 ranks,在考虑到数据间的相关性后通常会低于p与m。

本文设定参数c为1,并特别关注交通速度这一指标。 (r1, r2)代表空间与时间模态的秩,在空间与时间域之间存在显著的相关性关系下,其呈现较低水平的状态。

2)Learning of Dynamic Laplacian Matrix

该方法中针对图2左侧部分的整体动态Laplacian矩阵估计器,在分析过程中会按照预设的步骤对输入数据进行分解。

Experiments

为了确定合适的参数值I用于Laplacian矩阵估计器中的Eq.(18),我们通过图3左图进行了评估。正如预期所示,在实验中观察到平均绝对误差(MAE)随着参数值I的增大而显著下降。当参数值超过6时,MAE下降速率逐渐放缓。在此研究中将参数设定为6。

我们测试每个模型10次,并记录平均结果。观察表1与图4的数据后发现,在两个基准数据集上均展现出更低的预测误差水平的现象, 该方法相较于现有对比基准方法, 均展现出更低的预测误差水平的现象

总体而言,在现有技术中难以应对流量数据变化显著的传统线性预测方法VAR在性能上最为欠佳。相较于其他三种基于深度学习的方法DGCNN不仅表现出色其精度提升幅度在8%至10%之间具有显著优势。道路网络上的交通模式具有动态变化特征这一特性若被忽视则会导致参考方案预测结果准确性显著下降

在部分路段上,因为传感器出现故障或发生交通事故的原因,在实时采集到的交通样本中可能会出现局部异常的情况。

位于图5顶端的第一行位置,所选节点对应的受损观测数据将被替代为均值为零、方差设为1.0的高斯白噪声数据。而在图底端的位置,则使用数值'0'来替代那些受到损坏的数据点。

综合时空信息网络与动态拉普拉斯矩阵进行融合后发现,在性能指标上相较于目前最领先的基于图神经网络的两种方法(GAT和GraphSAGE),该模型展现出显著的容错性能提升幅度(提升幅度在10%至25%之间)。即使在故障率高达90%的情况下,DGCNN依然维持着令人瞩目的预测能力。面对同等程度的噪声干扰,其他主流方法的表现无异于断崖式下滑,这一现象在多个标准数据集上得到了印证,即该模型的能力增益会随着路网规模的增长而持续增强。通过引入一种新型的空间自适应机制,DGCNN能够识别存在于被污染交通样本中的空间依存变化特征,并相应地调节图卷积的感受野范围以捕捉更为复杂的特征关系。从图3的学习曲线可以看出,随着训练步数不断增加,相对于传统的GCNN和STGCN方法,DGCNN始终保持着最低水平的验证误差值,这充分证明了其优秀的训练效果和泛化能力。直观而言,Dynamic Laplacian matrix estimator使该模型具备了更强捕捉复杂交通网络因素影响的能力以及高度灵活适应能力

为了探讨新模型在交通网络空间依赖关系学习中的能力,在两个数据集上进行了大量模拟实验。本文首先测量了输入数据的空间顺序对空间依赖学习的影响,并采用了类似于Cui等人(2018)的研究方法进行分析。随后我们随机重新排列了输入数据的空间维度并进行了多次模型重新训练。实验结果表明无论是在拉普拉斯矩阵的学习还是在预测精度上均未发生显著变化这充分验证了该模型的有效性。此外我们还研究了一天内不同时间段跨度对空间依赖关系学习的影响并发现如图6所示在任意两个连续时间跨度上生成的Laplacian矩阵热图具有高度相似性这表明我们的新模型能够有效捕捉Laplacian矩阵的长期结构特征标记为" LOC1 "和" LOC2 "的位置进一步证实了该模型能够准确识别拉普拉斯矩阵的局部变化

全部评论 (0)

还没有任何评论哟~