PCNN模型解读：《Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks》

阅读量：

PCNN模型解读

本文是对Daojian Zeng, Kang Liu, Yubo Chen and Jun Zhao的论文《Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks》的简要解读。

Multi-instance problem

训练样本：bag

bag：由多个instance组成，普通的训练任务中训练样本就是instance
bag有label，这个label是对于整个bag的概念，而bag中instance的label是未知的

目的：找到bag和instance之间的逻辑关系，从而能够对一个新bag预测其整体label

常见loss function设计：对bag中所有instance做平均池化 / 最大池化 / attention机制，进而得到对bag整体的预测

预测方法：分training和evaluation时的不同情况，有bag-level的，也有instance-level的

PCNN

model

model architecture：
PCNN model
quintuple：

$E$ : word embeddings
$PF_1, PF_2$ : position embeddings 1, 2
$W$ : convolution filter matrix
$W_1$ : linear transformation matrix (=> get n1 relation scores)

MIL :

输入 - $T$ bags $\left \{ M_1, M_2, \dots, M_T \right \}$ , 其中 bag $M_i$ 包含：
- $q_i$ 个instance，分别为
- $\left \{ m_i^1, m_i^2, \dots, m_i^{q_i} \right \}$
输出 - 对于bag $M_i$ 的 $q_i$ 个instance，得到每个instance $m_i^j$
- ${\bold o}={\bold W_1}({\bold g} \circ {\bold r})+b$ ，即对于每种relation的score
  - （o是1×n1的vector，or是对relation r的score）
- 再做一次softmax，得到对于每种relation的条件概率 $p(r|m_i^j;\theta)=\frac{e^{o_r}}{\sum_{k=1}^{n_1}e^{o_k}}$

Training

bag-level loss function：按T个bag计算并求和。对每个bag $M_i$ ，算的是对该bag中（共 $q_i$ 个instance）条件概率p最大的那个instance求交叉熵（取log）。

预测：（二分类？）

When a trained PCNN is used for prediction, a bag is positively labeled if and only if the output of the network on at least one of its instances is assigned a positive label.

全部评论 (0)

还没有任何评论哟~

PCNN模型解读：《Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks》

PCNN模型解读本文是对DaojianZeng,KangLiu,YuboChenandJunZhao的论文《DistantSupervisionforRelationExtractionviaPie...

Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks

主要贡献 1.提出使用PCNN来自动提取特征。 2.往PCNN中加入multiinstancelearning，用来解决远程监督引发的错误标签问题。 3.提出分段进行maxpooling，从而考虑两个...

论文笔记：Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks

才疏学浅，欢迎批评指正 1.基于远程监督的关系抽取（DistantSupervisionforRelationExtraction） \qquad与传统的关系抽取方法不同，远程监督关系抽取利用知识库中...

论文笔记：Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Network

提出使用多实例结合分段CNN进行关系抽取主要内容：针对远程监督中利用启发式对其导致的错误标签以及特征提取过程中产生的噪音等两个问题，本文提出了一种基于多实例学习的分段CNN模型。

《GAN Driven Semi-distant Supervision for Relation Extraction》解读

原文链接 GANDrivenSemidistantSupervisionforRelationExtraction Abstract Introduction Method DatasetConstr...

论文浅尝 | Distant Supervision for Relation Extraction

Citation:Ji,G.,Liu,K.,He,S.,&Zhao,J.2017.DistantSupervisionforRelationExtractionwithSentenceLevelAtt...

Distant supervision for relation extraction 远程监督

论文链接：https://pan.baidu.com/s/1CrRm2TEEmhuvsSjNB4uF7g 提取码：0wlb 最近在读关系抽取方面的论文，发现Distantsupervision的概念出...

论文阅读-《Distant Supervision for Relation Extraction beyond the Sentence Boundary》

文章提出了首个将远程监督应用于跨句子关系提取的方法，通过整合句内和句间关系，利用图表示和多路径特征提取提高了准确性和鲁棒性。摘要文章提出了一种新的方法，用于在远程监督下进行跨句子的关系抽取。这种方...

【paper笔记】Robust Distant Supervision Relation Extraction via Deep Reinforcement Learning-P18-1199-ACL

Abstract 远程监督定义：定义：只要包含两个Entity的句子，都在描述同一种关系。用途：主要用来为关系分类任务扩充数据集。优点：能够很快速地为数据集打上标签缺点：它假设只要包含两个En...

论文笔记6：Distant supervision for relation extraction without labeled data

提出远程监督，从缺少标签的数据中抽取二元关系一、论文要解决的问题对于ACE等抽取任务，关系抽取的经典模型是基于监督学习的算法。此片论文提出了一种不依赖标签数据的算法，降低了对数据集的依赖，尤其适合...

是否确定退出登录?

PCNN模型解读：《Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks》