Joint Neural Architecture and Hyperparameter Search for Correlated Time Series Forecasting

阅读量：

本研究提出了一种高效的联合架构和超参数搜索框架（SEARCH）来解决时间序列预测中的关键问题。该框架通过引入架构超参数比较器（AHC），实现了对候选架构和超参数的高效排序与选择，并支持跨数据集的知识迁移以提升搜索效率。实验结果表明，SEARCH显著提高了预测精度、降低了内存消耗，并实现了快速的搜索过程，在多个标准数据集上验证了其有效性。该方法克服了现有自动时间序列预测方案中的主要局限性，并展示了在大数据规模下的良好可扩展性。

Investigating the Integration of Neural Architectures and Hyperparameter Optimization for Time Series Forecasting with Correlations (sigmod2023)

信息物理融合系统中的传感器通常用于采集相互关联的过程数据，并通过生成时间序列数据(Continuous Time Series, CTS)来实现对系统的动态行为分析与预测。时间序列预测的关键在于准确揭示其时间动态特性和空间相关性特征。基于深度学习的方法在这一领域展现出卓越的应用价值和性能表现。特别地，在自动化的CTS预测体系中（Autonomous CTS Prediction System, Auto-CTS），通过优化设计最佳深度学习架构（Optimal Deep Learning Architecture, ODL-Auto）以提升预测精度的优势已得到充分验证（如图1所示）。然而目前Auto-CTS方案仍处于基础探索阶段，在实际应用中主要局限于预设参数条件下的模型优化设计，并不具备良好的扩展性以应对复杂场景下的大规模应用需求。针对上述限制性问题本文提出 novel SEARCH算法框架（Systematic Efficient Hybrid Architecture Research, SEHAR），该框架旨在自动生成高效可靠的CTS预测模型结构并实现对其性能指标的有效优化与评估机制构建过程如下：首先将候选架构及其伴随超参数统一编码为联合图表示形式；其次引入创新性的体系结构超参数比较器(Architecture Hyperparameter Comparison Operator, AHCO)系统性地对所有体系结构超参数组合进行排序；最后针对排序结果中的最优候选方案进行深入性能评估并最终确定最优模型架构选择方案以实现对CTS预测模型的整体优化目标在此实验研究基础上通过6个典型基准数据集的测试结果表明所提出的SEARCH框架不仅可以显著减少人工干预步骤而且在预测精度和泛化能力方面均超越了传统人工设计方法及现有的Auto-CTS自动设计方案同时展现出良好的可扩展性特征

这篇论文基于VLDB 2022年的AutoCTS框架：Automated Correlated Time Series Forecasting（AutoCTS）的基础上展开续作研究。其中对时间序列预测问题展开研究，并展现了其独特价值。然而尽管研究提升了自动搜索序列结构的能力但文章未能探讨如何在满足特定预测条件时对模型进行剪枝处理这导致所建立的[模型]在训练与存储过程中所需资源消耗减少。

本研究计划解决的问题：1.现有自动超参数优化（CTSP）方法通常基于固定的超参数设定，在训练超级网络时面临架构与超参数联合搜索效率不足的问题。解决方案：传统的联合搜索方案依赖于人工干预程度较高以选择合适的超参数配置，在实际应用中可能导致架构选择非最优解，并使框架在一定程度上变为半自动化操作模式。此外，在每一次随机采样新的超参数组合时都需要执行现有的自动化架构搜索流程以获取最优网络结构，在大规模样本空间下会导致计算开销显著增加

(2) 低可扩展性问题。现有自动CTS预测方法通常存在扩展性不足的问题，在训练阶段需要将整个超网络保留在内存中；这可能会导致在大规模CTS设置下出现内存溢出（参考文献[22,31]）。具体而言，在时间序列N和历史时间戳P数量增长时；神经算子所涉及的内存成本会急剧上升。

采用一次性使用的方式，在多个相关数据集上积累经验后，在新数据集上实现更快捷的搜索效果。这表明构建通用可迁移的自动化系统具备显著提升搜索效率的可能性。

二文中提出的解决方法

本研究开发了一种名为SEARCH的可扩展且高效的联合架构与超参数搜索框架,该框架旨在优化模型性能并解决先前提到的问题.

首先，在多个体系结构与超参数（arch-hyper）的不同组合下构建了一个联合搜索空间的目标是为了筛选出最有效的体系结构与超参数组合，并最终突破第一道技术瓶颈。

为减少对内存的高消耗及可能限制扩展性的超网，在本研究中提出了新型架构超参数比较器(AHC)。该方法通过联合搜索空间对候选arch-hyper进行排序。给定两个候选arch-hyper的编码表示为二进制值，则 AHC 可以区分哪个 arch-hyper 具有最佳精度。从而推断候选主 hyper 的优先级排序。随后, 我们专注于训练排名前 k 的 arch-hyper, 并从中选择预测性能最佳的一个作为最终模型。由于该方法采用了轻量级图神经网络实现, 并且其输入直接基于 arch-hyper 的编码而非 CTS 数据, 因此该方法在性能上与现有 supernet 基础框架相比完全独立于 𝑃 和 𝑁 参数, 具有更高的可扩展性。

第三点建议的是，在已经训练好的一个数据集上应用其模型至未曾见过的新数据集，并通过这种方式来提升在新数据集上的学习效率，并以此来缓解第三个限制。

SCALABLE AND EFFICIENT JOINT SEARCH

Joint Search Space

联合搜索空间构建了一个涵盖st -块两方面的综合框架；该框架主要包含两个核心要素：第一部分是系统结构的设计方案（即算子及其连接方式），第二部分是系统的超参数设置（其中包括与系统结构相关的配置参数（如隐藏层维度）以及与训练优化相关的训练参数设置（例如学习率、批量大小等）。

1 ）Architecture Search Space.

1.1 Candidate operators

1.2 Topological connections

2） Hyperparameter Search Space.

我们考虑两种超参数:结构超参数和训练超参数

3）Architecture-Hyperparameter Comparator

这部分跳过。。。。。。在贝叶斯统计模型中有类似的方法

EXPERIMENTS

基于4个CTS数据集实施多步预测，在2个CTS数据集中应用单步预测。实验数据显示所提出的框架显著地克服了现有研究中的三大不足：其具有更高的预测精度、更低的内存占用量以及更快的搜索效率。

全部评论 (0)

还没有任何评论哟~

Joint Neural Architecture and Hyperparameter Search for Correlated Time Series Forecasting

JointNeuralArchitectureandHyperparameterSearchforCorrelatedTimeSeriesForecastingsigmod2023 信息物理融合系统中...

Time Series Forecasting (三) : hierachical and grouped time series

这一篇的主题主要是如何处理一组有层级关系的序列预测。例如我们进行未来30天的游客数量预测，需要涉及多个颗粒度：城市，省和国家。当然我们可以对每个维度单独建模进行预测，但是很明显这多个序列是有层级关系的...

论文阅读：Recurrent Neural Networks for Time Series Forecasting Current Status and Future Directions

typoracopyimagesto:./ RecurrentNeuralNetworksforTimeSeriesForecasting:CurrentStatusandFutureDirectio...

NLC: Search Correlated Window Pairs on Long Time Series(VLDB2022)

目前，许多应用，如物联网和工业互联网，从传感器连续收集数据点，形成长时间序列。发现时间序列之间的相关性是许多时间序列挖掘问题的基本任务。然而，现有的工作要么局限于检测关系的类型，如仅检测线性相关关系，...

Integrating Mamba and Transformer for Long-Short Range Time Series Forecasting———PRELIMINARIES

ProblemStatement 在长短期时间序列预测问题中，给定历史时间序列样本的回溯窗口L=x1,x2,..,xL，长度为L，其中每个时间步t的样本xt\in\mathbbR^M，包含M个变量，我...

Deep Learning for Time Series Forecasting: StateoftheAr

作者：禅与计算机程序设计艺术 1.简介时间序列预测Timeseriesforecasting是利用过去的数据（历史数据）对未来的某一时间点的情况进行预测的问题。它在金融、经济、物联网、医疗等多个领域...

Nonparametric Methods for Time Series Forecasting Using

作者：禅与计算机程序设计艺术 1.简介 Convolutionalneuralnetworkshavebeenwidelyusedintimeseriesforecastingbecauseofits...

Learning the Evolutionary and Multi-scale Graph Structure for Multivariate Time Series Forecasting

将时间序列的相互作用描述为一个图结构，变量表示为图节点，近年来的研究显示了将图神经网络应用于多元时间序列预测的巨大前景。沿着这条线，现有的方法通常假设决定图神经网络聚合方式的图结构或邻接矩阵是通过定义...

Integrating Mamba and Transformer for Long-Short Range Time Series Forecasting————4 METHODOLOG

4METHODOLOGY 图解 Mambaformer模型结合了Mamba和Transformer的元素，旨在进行时间序列预测。以下是Mambaformer模型的各个组成部分和流程的详细说明：嵌入层...

SLOTH: Structured Learning and Task-based Optimization for Time Series Forecasting on Hierarchies

背景介绍层次时间序列预测，主要针对的是多元时间序列中，各个序列能够形成一个层次结构的场景，层次结构中，满足父节点的序列值等于其子节点序列值之和。层次预估需要达成2个条件：首先，需要对层次中的每个节点...

是否确定退出登录?

Joint Neural Architecture and Hyperparameter Search for Correlated Time Series Forecasting

全部评论 (0)

相关文章推荐

Joint Neural Architecture and Hyperparameter Search for Correlated Time Series Forecasting

Time Series Forecasting (三) : hierachical and grouped time series

论文阅读：Recurrent Neural Networks for Time Series Forecasting Current Status and Future Directions

NLC: Search Correlated Window Pairs on Long Time Series(VLDB2022)

Integrating Mamba and Transformer for Long-Short Range Time Series Forecasting———PRELIMINARIES

Deep Learning for Time Series Forecasting: StateoftheAr

Nonparametric Methods for Time Series Forecasting Using

Learning the Evolutionary and Multi-scale Graph Structure for Multivariate Time Series Forecasting

Integrating Mamba and Transformer for Long-Short Range Time Series Forecasting————4 METHODOLOG

SLOTH: Structured Learning and Task-based Optimization for Time Series Forecasting on Hierarchies