4.7.深层循环神经网络

阅读量：

深层循环网络

就是更深了，因为之前的网络都只有一层隐藏层，弄多一点
在这里插入图片描述

我们将多层循环神经网络堆叠在一起，通过对几个简单层的组合，产生了一个灵活的机制。上图展示了一个具有LL个隐藏层的深度循环神经网络，每个隐状态都连续地传递到当前层的下一个时间步和下一层的当前步。

1.函数依赖关系

假设在时间步tt有一个小批量的输入数据Xt∈Rn×dX_t\in \R^{n\times d}(样本数:n，每个样本中的输入数：d)，同时，将第ll个隐藏层(l=1,⋯ ,Ll=1,\cdots,L)的隐状态设为KaTeX parse error: Expected group as argument to '\H' at position 3: \H_̲t^{(l)}\in \R^{…(隐藏单元数：h)，输出层变量设为Ot∈Rn×qO_t\in \R^{n\times q}(输出数:qq)，设置Ht(0)=XtH^{(0)}t = X_t,第ll个隐藏层的隐状态使用激活函数ϕt\phi_t，则：
Ht(l)=ϕ(Ht(l−1)Wxh(l)+Ht−1(l)Whh(l)+bh(l)) H_t^{{(l)}=\phi(H_t}{(l-1)}W{xh}^{{(l)}+H_{t-1}}{(l)}W_{hh}^{(l)}+b_h{(l)})
其中权重Wxh∈Rh×q,Whh(l)∈Rh×hW_{xh}\in \R^{h\times q},W_{hh}^{(l)}\in R^{h\times h}和偏置bh∈R1×hb_h\in \R ^{1\times h}都是第l个隐藏层的模型参数。

最后，输出层的计算仅基于第ll个隐藏层的最终的隐状态：
Ot=Ht(L)Whq+bq O_t = H_t^{(L)} W_{hq} +b_q
其中，权重Whq∈Rh×qW_{hq}\in \R ^{h\times q}和偏置bq∈R1×qb_q \in \R ^{1\times q}都是输出层的模型参数

使用多个隐藏层来获得更多的非线性性。

2.代码实现

复制代码

    import torch
    from torch import nn
    from d2l import torch as d2l
    
    batch_size, num_steps = 32, 35
    train_iter, vocab = d2l.load_data_time_machine(batch_size, num_steps)
    
    
    vocab_size, num_hiddens, num_layers = len(vocab), 256, 2
    num_inputs = vocab_size
    device = d2l.try_gpu()
    # num_layers 的值来设定隐藏层数
    lstm_layer = nn.LSTM(num_inputs, num_hiddens, num_layers)
    model = d2l.RNNModel(lstm_layer, len(vocab))
    model = model.to(device)
    
    num_epochs, lr = 500, 2
    d2l.train_ch8(model, train_iter, vocab, lr*1.0, num_epochs, device)
    
    
    python
    
    
![](https://ad.itadn.com/c/weblog/blog-img/images/2025-07-13/TRAqpe9EYDs3yxGvIuiLwV40QmaU.png)

全部评论 (0)

还没有任何评论哟~

4.7.深层循环神经网络

深层循环网络就是更深了，因为之前的网络都只有一层隐藏层，弄多一点我们将多层循环神经网络堆叠在一起，通过对几个简单层的组合，产生了一个灵活的机制。上图展示了一个具有LL个隐藏层的深度循环神经网络...

深度神经网络和循环神经网络,深层循环神经网络

深度学习和有效学习的区别深度学习和有效学习的区别分别是：1、深度学习是：DeepLearning,是一种机器学习的技术，由于深度学习在现代机器学习中的比重和价值非常巨大，因此常常将深度学习单独拿出来...

TensorFlow 堆叠循环神经网络（深层循环神经网络）

堆叠循环神经网络，又叫深层循环神经网络，就是将多个循环神经网络堆叠起来。在TensorFlow中，提供了tf.keras.layers.StackedRNNCells类来封装堆叠神经网络的单元。要注意...

循环神经网络进阶（门控循环神经网络、LSTM、深度循环神经网络、双向循环神经网络）

文章目录门控循环神经网络GRU 长短期记忆LSTM 深度循环神经网络双向循环神经网络门控循环神经网络GRU 该网络的提出也同样是为了应对普通RNN的梯度问题基本原理看这一篇就能懂：转载自知乎 ...

深度循环神经网络

importtorch fromtorchimportnn fromd2limporttorchasd2l batchsize,numsteps=32,35 trainiter,vocab=d2l.l...

《神经网络与深度学习》-循环神经网络

循环神经网络 1\.给网络增加记忆能力 1.1延时神经网络 1.2有外部输入的非线性自回归模型 1.3循环神经网络 2\.简单循环网络 2.1循环神经网络的计算能力 2.1.1循环神经网络的通用近似定...

深度循环神经网络：构建多层RNN模型

1\.背景介绍 1.1传统神经网络的局限性传统的神经网络，如多层感知机（MLP），在处理序列数据方面存在局限性。它们无法捕捉序列数据中存在的长期依赖关系，因为它们对每个输入都独立地进行处理，而忽略了...

李沐58_深层循环神经网络——自学笔记

!pipinstallupgraded2l==0.17.5d2l需要更新 python 简洁实现实现多层循环神经网络所需的许多逻辑细节在高级API中都是现成的。

深度学习笔记之循环神经网络(三)循环神经网络思想

深度学习笔记之循环神经网络——循环神经网络思想引言回顾：潜变量自回归模型循环神经网络思想困惑度引言上一节介绍了基于统计算法的语言模型。本节将介绍基于神经网络的序列模型——循环神经网络。

循环神经网络：深入浅出

1.背景介绍循环神经网络（RecurrentNeuralNetworks，RNN）是一种特殊的神经网络，它们在处理序列数据时具有很大的优势。序列数据是时间序列数据的一个广泛概念，例如自然语言、音频、...

是否确定退出登录?

4.7.深层循环神经网络

深层循环网络

1.函数依赖关系

2.代码实现

全部评论 (0)

相关文章推荐

4.7.深层循环神经网络

深度神经网络和循环神经网络,深层循环神经网络

TensorFlow 堆叠循环神经网络（深层循环神经网络）

循环神经网络进阶（门控循环神经网络、LSTM、深度循环神经网络、双向循环神经网络）

深度循环神经网络

《神经网络与深度学习》-循环神经网络

深度循环神经网络：构建多层RNN模型

李沐58_深层循环神经网络——自学笔记

深度学习笔记之循环神经网络(三)循环神经网络思想

循环神经网络：深入浅出