Advertisement

Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification阅读笔记

阅读量:

Att-BLSTM

Model

模型主要包括五部分:

  1. Input layer
  2. Embedding layer
  3. Lstm layer
  4. Attention layer
  5. Output layer

Word Embedding

没啥好说的…

Bidirectional Network

Bi-LSTM结构, 最后输出

Attention

Attention部分, 先对LSTM输出做非线性激活, 然后计算attention权重.

最终的句表示:

Classifying

损失函数: 加上L2正则的交叉熵

实验

数据集:SemEval-2010;参数设置:分别进行了测试;单词嵌入:分别测试了50维和100维的词向量;优化器:AdaDelta;学习率:比率设为1.0;批量大小:容量设为16;Dropout:在三个位置上分别设置了三个不同的比率(分别为3/4、3/4和5/8);评估指标:使用宏F-分数进行评估

全部评论 (0)

还没有任何评论哟~