读《DeepChannel: Salience Estimation by Contrastive Learning for Extractive Document Summarization》

阅读量：

组会讲的论文，AAAI-19的一个工作，记一记

任务：文本摘要生成

方法：

Extractive
基于分类，判断文章每一句话属不属于摘要
Abstractive
基于生成，常用的框架是encoder-decoder

Predominantly, most deep summarization models are aimed at establishing a direct mapping between documents and their summaries. Rather than attempting this, our DeepChannel is designed to calculate a channel probability that can assess the prominence or importance of any given document-summary pair.

传统的做法主要依赖于神经网络来直接建模文章与摘要之间的映射关系。相比之下，论文的核心思路在于构建一个条件概率模型P(D|S)，用于描述文章D在摘要S背景下的可能性分布，并基于此概率模型进行提取性的工作。

符号定义：

We represent a document-summary pair as (D,S). 其中D由 $|D|$ 个句子组成[ $d_1$ , $d_2$ , ⋯ , $d_{\lvert D\rvert }$ ]. 类似地,S由 $|S|$ 个句子组成[ $s_1$ , $s_2$ , ⋯ , $s_{\lvert S\rvert }$ ]. 即第 $i$ 个句子中的单词序列可表示为 $d_i = [\textit{word}_{w,i1}$ , $\textit{word}_{w,i2}$ ,…, $\textit{word}_{w,i,\lvert d_i \rvert }]$ , 其中 $\textit{word}_{w,i,j}$ 表示 $d_i$ 中的第 $j$ 个单词. 同样地,我们有 $s_j = [\textit{word}_{w,j1}$ , $\textit{word}_{w,j2}$ ,…, $\textit{word}_{w,j,\lvert s_j \rvert }]$ .

先验的假设：

We believe that sentences within a document exhibit conditional independence.
Another assumption posits that varying degrees of contribution by different summary sentences influence the generation of d_i.

条件概率模型：

公式描述：

对比学习：

Penalization Term：

We believe that a reasonable level of attention should meet the following two requirements.

A powerful i-th document sentence should prioritize its most relevant summary sentences. 理想的理想情况下, attention矩阵应当是one-hot形式,即满足ATA中非对角线元素均为零. 为此,我们应对其被赋予正惩罚值的位置予以特别关注

每个总结句都至关重要，并且每一个总结句都应受到来自某些文档句子的关注和考虑。

这样得到最终的损失函数：

NN部分得到后，给出贪婪抽取的算法：

注意的地方：

采用文档或句子编码的方式，则共享相同的GRU参数集合。
- 一个BP过程由一个文档和两个句子驱动，则需要共享相同的GRU参数集合。

全部评论 (0)

还没有任何评论哟~

读《DeepChannel: Salience Estimation by Contrastive Learning for Extractive Document Summarization》

组会讲的论文，AAAI19的一个工作，记一记任务：文本摘要生成方法： 1.Extractive 基于分类，判断文章每一句话属不属于摘要 2.Abstractive 基于生成，常用的框架是encod...

Ranking Sentences for Extractive Summarization with Reinforcement Learning

RankingSentencesforExtractiveSummarizationwithReinforcementLearning 摘要单个文档摘要是在保留其主要信息内容的同时生成较短版本的文档...

Ranking Sentences for Extractive Summarization with Reinforcement Learning

中文标题：基于强化学习的句子排序抽取式摘要开源链接：https://github.com/shashiongithub/Refresh 论文链接：https://arxiv.org/pd...

【论文笔记】Heterogeneous Graph Neural Networks for Extractive Document Summarization

文章使用异质图建模句子之间的关系，并将其用于抽取式摘要，取得了优于所有对比模型的效果（本文模型和对比模型均没有使用预训练语言模型，如BERT）。图的结构图中包含两类节点：词节点和句节点句节点与其...

每日论文《Heterogeneous Graph Neural Networks for Extractive Document Summarization》

作为提取性文档摘要中的关键步骤，学习跨句关系已通过多种方法进行了探索。一种直观的方法是将它们放在基于图的神经网络中，该网络具有更复杂的结构以捕获句子间的关系。在本文中，我们提出了一种用于提取摘要的基于...

Fine-tune BERT for Extractive Summarization

中文标题：精调BERT做抽取式摘要论文链接：https://arxiv.org/pdf/1903.10318.pdf 发表：EMNLP2019 组织：爱丁堡大学开源链接：GitHubn...

《Heterogeneous Graph Neural Networks for Extractive Document Summarization》论文阅读笔记（抽取式摘要）

目录摘要介绍相关工作方法图初始化异构图更新更新步骤句子选择实验结果 1. 论文<https://arxiv.org/abs/2004.12393 2. 代码<https://arxi...

Scaling Up Summarization: Leveraging Large Language Models for Long Text Extractive Summarization

本文是LLM系列文章，针对《ScalingUpSummarization:LeveragingLargeLanguageModelsforLongTextExtractiveSummarization...

Fine-tune BERT for Extractive Summarization（有代码pytorch）

本论文是extractivesummarization 摘要提取通常被定义为一个二分类问题，二分类问题表明这个句子是否在这个摘要中。我们的提取模型是建立在这个编码器之上，通过堆叠几个句子间Trans...

读论文2018 ACL A unified model for extractive and abstractive summarization using inconsistency loss

Abstract 提出了一个兼具抽取式和生成式优点的摘要模型。一方面，简单的抽取式模型可以包含句子级别的attention，且句子集合的ROUGE分数很高，但句子可读性差。另一方面，一个非常复杂的摘要...

是否确定退出登录?

读《DeepChannel: Salience Estimation by Contrastive Learning for Extractive Document Summarization》

组会讲的论文，AAAI-19的一个工作，记一记

任务：文本摘要生成

方法：

符号定义：

先验的假设：

条件概率模型：

公式描述：

对比学习：

Penalization Term：

NN部分得到后，给出贪婪抽取的算法：

注意的地方：

全部评论 (0)

相关文章推荐

读《DeepChannel: Salience Estimation by Contrastive Learning for Extractive Document Summarization》

Ranking Sentences for Extractive Summarization with Reinforcement Learning

Ranking Sentences for Extractive Summarization with Reinforcement Learning

【论文笔记】Heterogeneous Graph Neural Networks for Extractive Document Summarization

每日论文《Heterogeneous Graph Neural Networks for Extractive Document Summarization》

Fine-tune BERT for Extractive Summarization

《Heterogeneous Graph Neural Networks for Extractive Document Summarization》论文阅读笔记（抽取式摘要）

Scaling Up Summarization: Leveraging Large Language Models for Long Text Extractive Summarization

Fine-tune BERT for Extractive Summarization（有代码pytorch）

读论文2018 ACL A unified model for extractive and abstractive summarization using inconsistency loss