Sequence to Sequence Learning with Neural Networks_2014【machine translation】

阅读量：

The paper introduces an end-to-end differentiable neural machine translation model that significantly advances the field of sequence-to-sequence learning.

作者：Ilya Sutskever，Oriol Vinyals，Quoc V. Le

需补习知识：RNN，LSTM，SGD，PCA，beam search

what:

提出一个端到端的序列学习的编解码模式

应用于英文->法语的翻译任务

why：

尽管具有灵活性，在输入与输出上存在局限性。具体而言，在输入与输出过程中仅限于处理固定维数的向量，并且其维度是预先确定的。

how：

seq2seq模型由两部分组成：

encoder:

一个 deep LSTM
将长度可变的input sequence映射为定长vector

deoder:

另一个 deep LSTM
将上一步的定长vector解码到target sequence

该论文在原始LSＴＭ模型上的创新点：

１.two different LSTM

2.deep LSTMs(four layers) 比浅层LSTM好

3.reverse the order of the words of input sentence：

本方法降低了困惑度，并显著提高了BLUE分数；推测其翻转词汇有效的主要原因可能是引入了许多短期依赖关系。

4.预测时候使用beam search :(贪心搜索的一种)

仅在预测阶段使用，在训练阶段已知真实答案无需进行搜索。在进行预测时，假设词汇表为3个元素：{a, b, c}，并采用beam search的大小设为2； decoder解码的过程中：

4.1 在生成第一个词的过程中，在条件概率分布中选取概率最高的两个候选词a和c；通过这种方法得到的当前生成序列分别为a和c。

在生成第二个词的过程中，在结合当前序列和词汇表中的所有可能词汇后

4.3 后面不断重复这个过程，知道遇到结束符或者达到最大长度为止。

notes：

开发了一种基于seq2seq架构的编码解码模式，并被广泛应用于处理长句子；在长序列处理方面依然表现出色；由于采用了反转源语序而非目标语序的方法，在不破坏目标意义的前提下引入了许多短距离依赖关系；从而简化了整体优化过程；采用传统的随机梯度下降方法来进行模型训练

该方法能够有效避免出现梯度消失的情况；然而，在某些情况下可能会导致梯度爆炸现象出现（当计算出的梯度其范数超过设定阈值时会对其进行缩放处理）。

3.鉴于句子长短不一可能造成小批量处理时计算资源的浪费问题，在每次批量处理中优化了批量处理的策略以使各批次的平均长度相近，并因此实现了2倍效率的提升。

4.对词表外的词没法翻译。

问题：

1.RNN的输入时定长的，LSTM呢？输入输出不需要定长吗？

2.源句子经翻转后与目标句子之间的平均距离未发生变化。在最初的几项中其间距缩短了但后续几项之间的间距长度是否保持不变的问题？

全部评论 (0)

还没有任何评论哟~

Sequence to Sequence Learning with Neural Networks_2014【machine translation】

论文：SequencetoSequenceLearningwithNeuralNetworks 作者：IlyaSutskever，OriolVinyals，QuocV.Le 需补习知识：RNN，LST...

Sequence to Sequence Learning with Neural Networks

这是由谷歌的三位大神用seq2seq模型实现的基于神经网络的机器翻译（英法互译），基本的方法还是encoderdecoder,作为seq2seq的经典必读论文，本文与其他工作相比主要有创新点有： 1....

Sequence to Sequence Learning with Neural Networks

论文地址：<https://arxiv.org/abs/1409.3215 参考译文：< 参考笔记：1.<

（翻译）Sequence to Sequence Learning with Neural Networks

2模型 RNN，给定一个输入序列（x1,x2，…，xT），RNN通过循环计算下面的式子得到一个输出序列（y1,y2,…,yT）如何一个input和output是对应的，比如输入单词，输出是词性，就可...

[Paper Notes] Sequence to Sequence Learning with Neural Networks

Introduction 这篇文章有点类似于RNNEncoderDecoder 主要思想是：使用LSTM将源序列编码为一个固定维度的向量表示，然后使用另外一个LSTM从向量表示中解码出目标序列。

Sequence to Sequence Learning with Neural Networks翻译

由于最近学习的需要，对论文《SequencetoSequenceLearningwithNeuralNetworks》进行了不地道的翻译，翻译存在许多问题，因此仅供自己参考。也希望大家在留言中提出意见...

Sutskever2014_Sequence to Sequence Learning with Neural Networks

INFO:Sutskever2014SequencetoSequenceLearningwithNeuralNetworks ABSTRACT 1.UseoneLSTMtoreadtheinputse...

[论文翻译]Sequence to Sequence Learning with Neural Networks

引言本文是论文SequencetoSequenceLearningwithNeuralNetworks的个人翻译，肯定有很多理解不到之处，欢迎指出。摘要深度神经网络DNN是强大的模型，它在很多困...

【论文笔记】Sequence to Sequence Learning with Neural Networks

SequencetoSequenceLearningwithNeuralNetworks Abstract：DNN可以在有大量标记训练集下表现很好，但是无法处理用于序列映射到序列。在本文中，我们提出了...

【论文笔记】Sequence to sequence Learning with Neural Networks

本文模型：https://github.com/tensorflow/tensorflow/tree/master/tensorflow/models/rnn/translate 前一段时间在学习im...

是否确定退出登录?

Sequence to Sequence Learning with Neural Networks_2014【machine translation】

what:

why：

how：

全部评论 (0)

相关文章推荐

Sequence to Sequence Learning with Neural Networks_2014【machine translation】

Sequence to Sequence Learning with Neural Networks

Sequence to Sequence Learning with Neural Networks

（翻译）Sequence to Sequence Learning with Neural Networks

[Paper Notes] Sequence to Sequence Learning with Neural Networks

Sequence to Sequence Learning with Neural Networks翻译

Sutskever2014_Sequence to Sequence Learning with Neural Networks

[论文翻译]Sequence to Sequence Learning with Neural Networks

【论文笔记】Sequence to Sequence Learning with Neural Networks

【论文笔记】Sequence to sequence Learning with Neural Networks