[论文笔记]End-to-End Memory Networks with Knowledge Carryover for Multi-Turn Spoken Language Understandi

阅读量：

本文是对论文《End-to-End Memory Networks with Knowledge Carryover for Multi-Turn Spoken Language Understanding》的阅读笔记。文章探讨了自然语言理解（NLU）在对话系统中的核心作用，并指出传统NLU架构在处理多轮对话时的两个主要问题：上一轮对话的错误可能导致当前表现下降，且长历史中的知识未被有效携带。作者提出了一种基于端到端记忆网络的模型，该模型通过将句子和意图编码到内存中，并利用注意力机制从历史信息中提取知识来解决这些问题。模型通过RNN架构和知识注意力分布对历史信息进行编码，并将其应用于槽值填充和意图识别任务。实验表明该方法在保持上下文信息的同时提升了性能。

引言

这篇论文End-to-End Memory Networks with Knowledge Carryover for Multi-Turn Spoken Language Understanding是我的深入学习心得

NLU（Natural language understanding为自然语言理解技术，在实际应用中有时也被称为语音语言理解技术）构成了对话系统的关键模块。传统的架构通常以句子为单位进行处理，在这种模式下存在两个主要缺陷：一是上一轮对话中出现错误可能会影响当前轮的表现；二是长期对话中积累的知识可能无法在当前轮中被有效继承。

针对这两个关键问题，作者设计了一个基于端到端记忆网络的模型用于建模多轮对话中的信息传递过程。其中模型同时编码了输入句子及其意图，并将槽位作为嵌入形式存储于内存中。在解码过程中，我们采用了注意力机制以整合之前保存的信息以提升意图识别与槽位填充的效果。

简介

NLU将用户的输入的语句转换到语义框架中以捕获核心语义信息。

在典型的NLU架构中, 首先通过分析输入语句来识别具体领域, 然后通过该领域的详细分析来识别意图类型并填充与之相关的语义信息.

图1展示了用户的语句"express fishing intentions for Bob this weekend"及其对应的发送邮件操作send email(contact name="Bob", subject="fishing intentions this weekend")。

在传统研究中，在领域预测与意图识别方面主要关注的是分类任务，在槽值填充方面则集中于序列标注技术的研究

上下文信息已被证明对NLU极为重要，例如图1的下半部分展示了两段文字：其中一段包含了发送邮件（第一段所述的内容）中的正文部分；因此，在保留了上下文信息的情况下，则更有可能判断这两个语义槽message和send_email具有相同的意图。

该研究构建了一个基于RNN架构的方法，在对当前语句进行标记标注前需获取关键性外部记忆数据。该研究首次探索使用端到端神经网络模拟长距离自然语言理解中的持续信息传递机制。

端到端的记忆网络

针对自然语言理解（NLU）子任务，在模型训练过程中，在线读取并处理历史对话数据集中的离散对话对 $\{x_i\}$ ；对于当前对话上下文 $\pmb c = w_1, \dots, w_T$ 进行计算，并生成相应的意图识别结果与命名实体识别信息；每个生成的语义标签均包含意图识别和命名实体识别的信息。

Architecture

该模型将对话历史的所有语句转化为嵌入向量后存储于内存中。随后将当前输入的表达式与内存中的其他表达式进行对比，并借助注意力机制整合上下文信息。接着在这一基础上编码器所掌握的知识被用来推断意义标签。最后部分阐述了整个系统的四个核心环节。

Memory Representation

为了保存历史对话的信息，基于RNN技术将每个回合中的 $x_i$ 转化为一个 $d$ 维空间中的向量 $m_i$ 。当前输入语句 $c$ 同样被映射到这一空间中的向量表示形式为 $\bm{u}$ ：

\bm{m}_i = \text{RNN}_{men} (\bm{x}_i) \tag{1}

u = \text{RNN}_{in}(c) \tag{2}

Knowledge Attention Distribution

在嵌入空间中采用加性核函数的方法对给定输入 $u$ 与每一个记忆向量 $m_i$ 进行点积运算以获得其匹配程度这一过程被称为加性核函数映射

在模型中， $p_i$ 被定义为建模知识传递过程中的注意力权重分配机制，在这种机制下能够更深入地理解当前内容。

Knowledge Encoding Representation

通过从历史对话中提取知识并使用注意力机制将各个 $m_i$ 进行加权求和来获得历史向量 $h$ :

h = \sum_{i} p_im_i \tag 4

接着将该向量 $h$ 与当前输入嵌入层的表示 $u$ 一起传递到权重矩阵 $(W_{kg})$ , 经过线性变换后生成输出的知识编码向量 $o$ :

o = W_{kg}(h+u) \tag 5

在这里, 权重矩阵$(W_{kg})$被设计用于提取并整合所涉及的知识信息。

Sequence Tagging

为了提升标注效果而加入补充的知识后，在这种情况下我们希望估计给定输入单词序列 $\pmb c$ 对应的标签序列 $\pmb y$ 。为此我们采用了基于RNN的槽标签器（Slot Tagger）并通过将知识向量 $o$ 输入到该模型中以便提取相关知识信息从而得到公式如上所示：

RNN Tagger

该系统旨在为输入序列中的每一个词分配相应的语义标签。该系统基于Elman型 recurrent neural network架构设计。

知识负载

为了阐述历史轮次建模编码的知识体系，在每个时间步 $t$ 时，在公式 $(5)$ 中输入知识编码向量 $o$ 以及对应的单词符号 $w_t$ 至RNN模型中进行处理。基于此，在每个时间步 $t$ 时，RNN模型的隐藏层状态可以通过以下公式进行计算：

h_t = \phi(M_o + W_{w_t} + Uh_{t-1}) \tag{14}

其中 $h_t$ 表示第 $t$ 个隐藏状态。

如图3所示，红色虚线表示携带的知识。

全部评论 (0)

还没有任何评论哟~

[论文笔记]End-to-End Memory Networks with Knowledge Carryover for Multi-Turn Spoken Language Understandi

引言本文是论文EndtoEndMemoryNetworkswithKnowledgeCarryoverforMultiTurnSpokenLanguageUnderstanding的阅读笔记。

End-To-End Memory Networks 论文翻译

摘要我们介绍一种在大的外置内存的带循环注意力模型的神经网络。架构是MemoryNetwork的一种，而需要较少的监督学习，它也能被看做是一种RNNsearch的扩展。它可以用作问答系统和语言模型...

论文阅读：End-To-End Memory Networks

论文阅读：EndToEndMemoryNetworks 一、Abstract 这是Facebook在Memorynetworks之后提出的一个更加完善的模型，《Memorynetworks》中I和G模...

关于GCN的论文笔记--End-to-end Structure-Aware Convolutional Networks for Knowledge Base Completion

用于知识图谱完成的端到端结构感知卷积网络论文题目EndtoendStructureAwareConvolutionalNetworksforKnowledgeBaseCompletion 论文出自a...

《End-to-end memory networks》

这里介绍了一种可以端到端训练的记忆网络MemN2N，可以利用额外的知识库。代码地址：https://github.com/facebook/MemNN 贡献可以端到端训练 multiplyhopa...

End-To-End Memory Networks

关键词 End2End,MemoryNetworks,Multiplehops 来源 arXiv2015.03.31publishedatNIPS2015 问题当前AI研究面临两大问题： 1.如何在...

【论文笔记】An End-to-End Model for QA over KBs with Cross-Attention Combining Global Knowledge

一、概要该文章发于ACL2017，在KnowledgebasebasedquestionansweringKBQA上，作者针对于前人工作中存在没有充分考虑候选答案的相关信息来训练questionre...

【阅读笔记】：End-to-end Structure-Aware Convolutional Networks for Knowledge Base Completion

为解决知识图谱（KG）中三元组不完整问题，本文结合加权图卷积神经网络（WGCN）和ConvTransE两个模块，提出了SACN（StructureAwareConvolutionalNetworks）...

论文精读：memory network以及End-To-End Memory Networks

该文提出了一个memorynetwork，该网络基于longtermmemorycomponent。将该模型应用于QA（查询回答）场景下文章目录 1记忆网络组件和工作原理 2记忆网络在文本领域应用 ...

End-to-end Structure-Aware Convolutional Networks for Knowledge Base Completion

研究问题将图网络作为编码器，将ConvTransE作为解码器，应用于知识图谱补全任务背景动机 ConvE模型在做卷积之前对embedding实施了reshape操作，并且没有保留TransE系列模...

是否确定退出登录?

[论文笔记]End-to-End Memory Networks with Knowledge Carryover for Multi-Turn Spoken Language Understandi

引言

简介

端到端的记忆网络

Architecture

Memory Representation

Knowledge Attention Distribution

Knowledge Encoding Representation

Sequence Tagging

RNN Tagger

知识负载

全部评论 (0)

相关文章推荐

[论文笔记]End-to-End Memory Networks with Knowledge Carryover for Multi-Turn Spoken Language Understandi

End-To-End Memory Networks 论文翻译

论文阅读：End-To-End Memory Networks

关于GCN的论文笔记--End-to-end Structure-Aware Convolutional Networks for Knowledge Base Completion

《End-to-end memory networks》

End-To-End Memory Networks

【论文笔记】An End-to-End Model for QA over KBs with Cross-Attention Combining Global Knowledge

【阅读笔记】：End-to-end Structure-Aware Convolutional Networks for Knowledge Base Completion

论文精读：memory network以及End-To-End Memory Networks

End-to-end Structure-Aware Convolutional Networks for Knowledge Base Completion