论文阅读：End-To-End Memory Networks

阅读量：

一、Abstract

这是Facebook在Memory networks之后提出的一个更加完善的模型，《Memory networks》中I和G模块并未进行复杂操作，只是将原始文本进行向量化并保存，没有对输入文本进行适当的修改就直接保存为memory。所以O和R模块承担了主要的任务，但是从最终的目标函数可以看出，在O和R部分都需要监督，也就是我们需要知道O选择的相关记忆是否正确，R生成的答案是否正确。

这就限制了模型的推广 ，太多的地方需要监督，不太容易使用反向传播进行训练。因此，本文提出了一种end-to-end的模型，可以视为一种continuous form的Memory Network，而且需要更少的监督数据便可以进行训练。论文中提出了单层和多层两种架构，多层其实就是将单层网络进行stack。

二、Introduction

1、背景和动机

现在人工智能研究的两个挑战性的问题：

第一是能够构建模型，使其能够进行多个计算步骤，以服务于回答问题或者完成一个任务；

第二是可以建模时序数据中的长期依赖关系。

最近，基于存储和 attention 机制的模型开始复兴，而构建这种存储对解决上述两个问题，提供了可能的方向。在前人的工作中，存储是建立在连续的表达上；从该存储中进行读取和写入的操作，以及一些其他的操作步骤，都通过神经网络的动作来建模。

在本文中，作者提出了一种新颖的 RNN 结构，其能够循环的从一个可能的大型额外记忆单元中多次进行读取，然后输出一个符号。我们的模型可以看做是连续的 Memory Network。我们的模型也可以看做是一种 RNNsearch 的版本，每输出一个符号都带有多个 hops。我们的实验证明，长期记忆的 the multiple hops 对取得较好的效果，具有关键性的作用。训练这些记忆表达，可以以一种 end-to-end manner 来将其接入到我们的模型中。

2、Approach

我们的模型将离散元素集合 x1, x2, … xn（存储在 memory 中）和 query q 作为输入，然后输出一个 answer a。每一个 xi，q，a 都包含从字典中得到的符号表达。模型将所有的 x 写入到 memory，直至达到一个固定的 buffer size，然后为 x 和 q 找到一个连续的表达。这个连续的表达然后通过 multiple hops 来进行处理，输出 a。这就允许误差信号可以沿着多次记忆的访问进行传播，在训练过程中传递到输入。

2.1 Single Layer

Input memory representation :

假设我们给定了一个输入集合 x1, x2, … , xi 并且存储在记忆单元中。整个 {xi} 的集合可以转换为 memory vector {mi}，通过将每一个 xi 映射到连续的空间，最简单的情况就是，利用 an embedding matrix A。Query q 然后也被映射，得到一个中间状态 u。在 embedding space 中，我们通过采用内积，然后用 softmax 函数，计算 u 和每一个 memory mi 之间的匹配：

通过这种方式定义的 p，是基于输入的概率向量。

Output memory representation :

每一个 xi 都有一个对应的输出向量 ci（通过另一个 embedding matrix C 来进行转换）。从记忆 o 中得到的响应，用概率向量 p 和转换输入 ci 之间的加权求和：

因为从输入到输出的函数是平滑的，我们可以简单的计算其梯度，然后进行反传即可。其他最新提出的一些 memory 和 attention 的方法，也是采用这种方法。

Generating the final prediction :

在单个 layer 的情况下，输出向量 o 的和，以及输入映射 u 都被用一个权重矩阵 W 进行传递，然后用 softmax 得到其预测的 label：
在这里插入图片描述

总体的模型如图 1 （a）所示。

2.2 Multiple Layers :

我们现在将模型拓展为可以处理 K hop operations 的情况。这些 memory layers 可以通过如下的方式进行堆叠：

1). 第一层上面的那些 layers 的输入是：来自 layer k 的输出 o^k 以及输入 u^k 的和：
uk+1=uk+ok u^{k+1}=uk+o^k
2). 每一层都有其各自的 embedding matrices Ak,Ck，用于映射其输入x_i。

3). 在网络的顶端，W 的输入也考虑了 the top memory layer 的输入和输出：
a=Softmax(WuK+1)=Softmax(W(oK+uK)) a=Softmax(Wu^{{K+1})=Softmax(W(o}K+u^K))

作者在这个模型中，考虑了如下两种加权的方式：
在这里插入图片描述

全部评论 (0)

还没有任何评论哟~

论文阅读：End-To-End Memory Networks

论文阅读：EndToEndMemoryNetworks 一、Abstract 这是Facebook在Memorynetworks之后提出的一个更加完善的模型，《Memorynetworks》中I和G模...

论文精读：memory network以及End-To-End Memory Networks

该文提出了一个memorynetwork，该网络基于longtermmemorycomponent。将该模型应用于QA（查询回答）场景下文章目录 1记忆网络组件和工作原理 2记忆网络在文本领域应用 ...

End-To-End Memory Networks 论文翻译

摘要我们介绍一种在大的外置内存的带循环注意力模型的神经网络。架构是MemoryNetwork的一种，而需要较少的监督学习，它也能被看做是一种RNNsearch的扩展。它可以用作问答系统和语言模型...

《End-to-end memory networks》

这里介绍了一种可以端到端训练的记忆网络MemN2N，可以利用额外的知识库。代码地址：https://github.com/facebook/MemNN 贡献可以端到端训练 multiplyhopa...

End-To-End Memory Networks

关键词 End2End,MemoryNetworks,Multiplehops 来源 arXiv2015.03.31publishedatNIPS2015 问题当前AI研究面临两大问题： 1.如何在...

End-To-End Memory Networks代码研读

本文学习的代码来自于知乎文章：https://zhuanlan.zhihu.com/p/29679742 代码地址为：https://link.zhihu.com/?target=https%3A//...

论文阅读：Memory Equipped Self-Attention for End-to-End Speech Recognition

语音识别阅读笔记SANM:MemoryEquippedSelfAttentionforEndtoEndSpeechRecognition interspeech2020 下载链接： <https://...

《END-TO-END OPTIMIZED IMAGE COMPRESSION》论文阅读

端到端的图像压缩–《ENDTOENDOPTIMIZEDIMAGECOMPRESSION》 ENDTOENDOPTIMIZEDIMAGECOMPRESSION论文阅读端到端的图像压缩《ENDTOEND...

【论文阅读】DeepVO: Towards End-to-End Visual Odometry with Deep Recurrent Convolutional Neural Networks

端到端视觉里程计与传统视觉里程计的区别相较于传统的视觉里程计，端到端的方法可以认为是把特征提取、匹配、位姿估计等模块用深度学习模型进行了替代。不同于那种用深度学习模型取代里程计框架一部分的算法，端到...

记忆网络之End-To-End Memory Networks

记忆网络之EndToEndMemoryNetworks 这是FacebookAI在Memorynetworks之后提出的一个更加完善的模型，前文中我们已经说到，其I和G模块并未进行复杂操作，只是将原始...

是否确定退出登录?

论文阅读：End-To-End Memory Networks

一、Abstract

二、Introduction

1、背景和动机

2、Approach

2.1 Single Layer

全部评论 (0)

相关文章推荐

论文阅读：End-To-End Memory Networks

论文精读：memory network以及End-To-End Memory Networks

End-To-End Memory Networks 论文翻译

《End-to-end memory networks》

End-To-End Memory Networks

End-To-End Memory Networks代码研读

论文阅读：Memory Equipped Self-Attention for End-to-End Speech Recognition

《END-TO-END OPTIMIZED IMAGE COMPRESSION》论文阅读

【论文阅读】DeepVO: Towards End-to-End Visual Odometry with Deep Recurrent Convolutional Neural Networks

记忆网络之End-To-End Memory Networks