Advertisement

文献阅读《Spatio-Temporal Graph Convolutional Networks: A Deep Learning Frameworkfor Traffic Forecasting》

阅读量:

期刊信息

IJCAI2018(顶会)(北大)

Abstract

本文聚焦的问题:交通预测

现在的问题:①中期和长期的预测任务②忽略了时间和空间上的相关性

本文的贡献:设计了STGCN(时空图卷积网络)处理交通领域的时间序列预测

优点:训练速度快,参数少

特点:①we formulatethe problem on graphs 在图上公式化难题② build the model with complete convolutional structures使用完整的卷积网建立模型

6 Conclusion and Future Work

结论:

STGCN 时空图卷积 效果好

通过时空卷积块集成图卷积和门控时间卷积

未来:

未来,我们将进一步优化网络结构和参数设置。此外,我们提出的框架可以应用于更通用的时空结构化序列预测场景,如社交网络的演化和电子商务系统中的偏好预测等。

4 Experiments

4.1 Dataset Description

验证模型:两个真实数据集

Beijing Municipal TrafficCommission and California Deportment of Transportation

北京市交通委员会和加利福尼亚州交通部

BJER4 and PeMSD

采用双环检测器从北京市东环4号干线主要区域采集BJER4。我们选择了12条道路进行实验。交通数据每5分钟汇总一次。使用的时间段为2014年7月1日至8月31日,周末除外。我们选择历史速度记录的第一个月作为训练集,并分别作为验证集和测试集

BJER4数据集:

采集时间:2014年7月1日至8月31日,周末除外

我们选择历史速度记录的第一个月作为训练集,并分别作为验证集和测试集


(咋说呢,阅读笔记还得是阅读笔记,干做抄写的工作就没意思了

图3:加利福尼亚州第7区的PeMS传感器网络(左),每个点表示一个传感器站;PeMSD7中加权邻接矩阵的热图(M)(右)。

4.2 Data Preprocessing 数据预处理

  • 两个数据集中的标准时间间隔设置为5分钟。
  • 因此,道路图的每个节点每天包含288个数据点。
  • 线性插值方法用于填充数据清理后的缺失值。
  • 此外,数据输入采用Z-Score方法规范化




在PeMSD7中,基于交通网络中站点之间的距离来计算道路图的邻接矩阵。加权邻接矩阵Ww可以形成为 其中,wij是由dij(站点之间的距离dj)决定的边的权重。σ2和是控制矩阵W的分布和稀疏性的阈值,分别分配为10和0.5。图右侧显示的W可视化

关于W的邻接阵的计算

4.3 Experimental Settings

所有实验都在Linux集群上编译和测试(CPU:Intel(R)Xeon(R)CPU E5-2620 v4@2.10GHz,GPU:NVIDIA GeForce GTX 1080)。为了消除非典型交通,我们的实验中只采用了工作日交通数据[Liet等人,2015]。我们执行网格搜索策略来定位验证中的最佳参数。所有测试都使用60分钟作为历史时间窗口,也就是说,12个观测数据点(M=12)用于预测未来15、30和45分钟的交通状况(H=3,6,9)。

实验条件:CPU: Intel(R) Xeon(R) CPU E5-2620 v4 @ 2.10GHz, GPU:NVIDIA GeForce GTX 1080

网格搜索 寻找最佳参数


评估指标和基线

测量和评估不同方法的性能,平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和采用均方根误差(RMSE)。我们将我们的框架STGCN与以下基线进行比较:1)。历史平均值(HA);2.线性支持向量回归;3.自回归综合移动平均数;4.前馈神经网络;5.全连通LSTM(FC-LSTM)[Sutskeveret等人,2014];6.图卷积GRU(GCGRU)

评价指标:MAE平均绝对误差、MAPE平均绝对百分比误差、RMSE均方根误差

基模型:1.历史平均值(HA);2.线性支持向量回归;3.自回归综合移动平均数;4.前馈神经网络;5.全连通LSTM(FC-LSTM)[Sutskeveret等人,2014];6.图卷积GRU(GCGRU)

STGCN模型对于BJER4和PeMSD7(M/L),ST Conv区块的三层厚度分别为64、16、64。在具有切比雪夫多项式近似的STGCN(Cheb)模型中,图卷积核大小Kan和图卷积核尺寸Ktare都被设置为3,而在具有一阶近似的STGC N(1st)模型中Kis被设置为1(?)。我们通过使用RMSprop对批量大小为50的50个时期的均方误差进行最小化来训练我们的模型。初始学习率为10-3,每5个时期的学习率为0.7

时空卷积块三个层的设置:the channels of three layers in ST-Conv block are 64, 16, 64 respectively.

图卷积和时间卷积块的卷积核大小都设置为3:graph convolution kernel size K and temporal convolution kernel size Kt are set to 3

RMSprop对批量大小为50的50个时期的均方误差进行最小化来训练模型

初始学习率为10-3,每5个时期的学习率为0.7

4.4 Experiment Results

表1和表2展示了STGCN和基线在数据集BJER4和PeMSD7(M/L)上的结果。我们提出的模型在所有三个评估指标中都取得了具有统计学意义的最佳性能(双尾T检验,α=0.01,P<0.01)。我们可以很容易地观察到,传统的统计和机器学习方法可能在短期预测中表现良好,但由于误差积累、记忆问题和缺乏空间信息,它们的长期预测并不准确。ARIMA模型由于无法处理复杂的时空数据而表现最差。深度学习方法通常比传统的机器学习模型取得更好的预测结果。

S1:表1表2 的含义(不说也懂)

S2:我们的模型性能最好,双边T检验

不同的方法在北京交通数据集上的性能表现

不同的方法在P数据集上的表现

空间拓扑的好处

以前的方法没有结合空间拓扑,而是以粗粒度的方式对时间序列进行建模。

不同的是,通过对传感器的空间拓扑进行建模,我们的STGCN模型在短期、中期和长期预测方面取得了显著的改进。

STGCN的优势在数据集PeMSD7上比BJER4更明显,因为PeMS的传感器网络更复杂、更结构化(如图3所示),并且我们的模型可以有效地利用空间结构进行更准确的预测。

3 Proposed Model(提出模型

3.1 Network Architecture(网络架构

3.2 Graph CNNs for Extracting Spatial Features(提取空间特征的图卷积网络

3.3 Gated CNNs for Extracting Temporal Features(门控卷积网提取时间特征

3.4 Spatio-temporal Convolutional Block (时空卷积块

2 Preliminary(准备

2.1 Traffic Prediction on Road Graphs(道路交通流量预测

2.2 Convolutions on Graphs(图上的卷积

1 Introduction

交通预测多么多么的重要


不用看了,说的就是短期预测好,长期不好,在提出问题

mid-and-long term traffic predictioncan be roughly divided into two categories: dynamical modeling and data-driven methods先前的中长期预测的两种方法(动态建模)&(数据驱动方法)好,可以了。


跳 还是在指出问题 提出问题

文献阅读方法论:

标题 摘要 结果的图 实验材料和方法 摘要 结果和讨论 引言在最后大致读 摘要

全部评论 (0)

还没有任何评论哟~