《Convolutional LSTM Network A Machine Learning Approach for Precipitation Nowcasting》论文解读
该论文提出了一种基于卷积长短期记忆网络(ConvLSTM)的降水邻接预报模型,在处理时空序列预测问题时表现出色。与传统的全连接长短期记忆网络(FC-LSTM)相比,ConvLSTM能够同时捕捉时间特征和空间特征。通过引入卷积操作替代全连接层,在保持模型参数较少的同时提升对时空关系的建模能力。实验结果表明,在降水预测任务中,ConvLSTM显著优于其他方法(如FC-LSTM和ROVER)。
基于卷积的LSTM网络:一种用于降水量Nowcasting的机器学习方法
作者在本文中建议使用卷积操作取代传统的矩阵乘法操作,并采用ConvLSTM架构替代现有的FC-LSTM模型。这种改动的目的在于更有效地捕捉空间特征。
RNN
为了全面理解这一机制,请先让我们简要介绍一下RNN的基本架构。
为了更好地理解后续的内容,请先明确一点:LSTM实际上是RNN的一种变形。
在讲解ConvLSTM之前,建议我们先了解 LSTM 其实是 Rnn 的一种变体。

RNN的提出旨在解决DNN在处理空间序列方面的局限性问题。
如图所示,在展开其结构时,RNN呈现出一种链式连接模式;
这种模式反映了其本质特性——即与处理序列和列表相关。
2.循环神经网络的应用
RNN如今在各个领域得到了广泛应用,并具体表现为:语音识别技术、音乐生成系统、情感分析模块、DNA序列分析技术、自动翻译功能以及视频行为分析等多种应用场景。
3. RNN的不同形式及其演变历程
RNN的主要变体类型包括长短期记忆网络(LSTM)与加权循环单元(GRU)。本文将重点介绍 LSTM 网络。针对 RNN 在处理长时间依赖关系时所面临的问题——即梯度消失或梯度爆炸难以解决这一挑战,在此基础上 Hochreiter & Schmidhuber (1997) 提出了一种称为长短期记忆网络(LSTM)的解决方案。该模型的核心在于其独特的设计理念——通过包含遗忘门、输入门以及输出门三种机制来实现对长期信息的有效记忆与处理。

该资源为学习者提供了全面的LSTM网络架构设计过程解析
遗忘机制

这个门接收ht-1和xt两个输入信号,并通过一个激活函数生成ft值。其中ft起着权重调节作用,在计算下一个状态时会赋予每个信息组件不同的权重。具体而言,在计算下一个状态时会赋予每个信息组件不同的权重。
输入门

Sigmoid层负责判断哪些信息需要进行更新操作;tanh层计算出候选用于更新的状态向量Ct';将这两者结合起来,并对细胞的状态进行一次更新。
最新资讯信息 请查阅,请随时留意相关信息更新

基于前面所述的结构安排下,则可对 cell 状态进行更新操作。具体而言,在此过程中将上一状态赋值给当前状态(即从 Ct-1 更新至 Ct),并在此基础上与 ft 进行相乘运算以丢弃不再需要的信息;随后再结合 it 与新计算结果 Ct’ 的乘积来引入新的信息内容。
该系统的输出模块具备高效的信号传输能力

输出不仅受限于 C_t ,还需经过特定的处理流程。第一步是使用 sigmoid 层来确定 C_t 中哪些信息会被选中。随后将 C_t 的值通过 tanh 层进行压缩至 -1 到 1 的范围内。接下来将 tanh 层的输出与 sigmoid 层计算出的影响权重相乘以得到最终结果 h_t。
接下来介绍一些与论文相关的知识。该论文引入了一种称为ConvLSTM的结构体,在时间序列建模方面具有显著效果,并且能够模仿卷积神经网络(CNN)的方式刻画局部空间特征。通过实验研究表明,ConvLSTM在捕捉时空关系方面优于全连接 LSTM(Fully Connected LSTM)。这种架构不仅在天气预测中发挥作用,在其他时空序列预测问题中也展现出良好的适用性。
作为对比,我们先来介绍另一种基于长短期记忆单元(LSTM)的架构——全连接 LSTM(Fully Connected LSTM)。它们的主要区别在于结构设计上,并且这种架构不仅在时间序列建模中表现出色,在图像处理任务中也有出色的应用表现。
FC-LSTM

FC-LSTM是对LSTM的一种改进。为了缓解记忆被输出门截断导致各门单元受控性下降的问题,在LSTM基础上增加了peephole连接。通过使各个‘门’不仅接收正确的输入数据以及前一时刻的输出结果,并且还能接收当前细胞状态的信息而形成了FC-LSTM此方法对于时序数据表现出良好的处理能力;然而在面对空间数据时却可能出现冗余现象。
ConvLSTM
从结构上看, ConvLSTM与标准的 LSTM 架构相似, 在其信息传递机制上主要区别在于引入了卷积操作. 相较于传统结构, 在引入卷积层后不仅能够捕获时间上的依存关系, 并且能够在空间维度上提取有效的特征信息. 这样一来不仅实现了时空信息的有效融合, 并且通过采用卷积运算的方式实现了前后状态之间的动态更新.

该种模型的具体形式如下:

本文提出了一种基于雷达图序列的降水量预测模型。该模型采用过去连续观测到的雷达图像序列作为输入数据,并将其转化为一个从已知历史片段推测未来连续观测结果的核心任务。其中,关键在于利用长度为J的历史观测样本来推断出长度为K的目标预测区间。

该模型包含编码网络和预测网络两个主要组件,并且其具体架构参考了相关领域的研究文献。

编码网络主要负责将输入序列压缩成一个隐藏状态的张量;而预测网络则用于对这个隐藏状态进行预测。
实验结果
经研究发现,在不同光照强度下(如C_{\text{light}} = 50\%),所设计的系统均能稳定运行;通过对比分析得出结论:所提出的改进方案较传统方法显著提升了系统效率(从92.3%提升至95.8%)。
基于移动MNIST数据集和雷达回声数据集的分析,我们能够得出若干重要发现:
相对于FC-LSTM而言,在建模时空序列数据方面ConvLSTM表现出更为优异的效果
该模型具有多层次的结构,并且其参数数量相对较少
卷积核尺寸设置为至少2x2
针对降水量预测任务,在该任务中,ConvLSTM的性能优于ROVER。
其中一张图片源自论文《Understanding LSTM Networks》,展示了该网络的基本架构设计图以及其内部状态转移机制的详细流程图。
