ESimCSE: Enhanced Sample Building Method for Contrastive Learning of Unsupervised Sentence Embedding

阅读量：

论文目的

SimCSE 使用dropout作为数据增强的最小方法，因为transformer使用位置embedding，句子的长度信息会被编码到句子embedding中，所以unsup-SimCSE的正对包含相同的长度信息。所以unsup-SimCSE训练的正样本对估计是有偏的，会倾向于将有相同或类似长度的句子是相似的，通过统计观察，发现unsup-SimCSE的确有这个问题。为了缓解它，使用一个简单的重复操作来修改句子，然后将句子和修改后的句子输入transformer来得到正对，且从CV中引入momentum contrast在不增加计算量的情况下来扩大负样本的数量，提出的两个方法分别用于政府样本，称为 E nhanced Unsup-SimCSE (ESimCSE)。

Proposed ESimCSE: Enhanced unsup-SimCSE

Word Repetition

举例说明sub-word的重复使用情况。给定一个序列 $x=[x_1,\dots,x_N]$ 其中 $x_i$ 表示第i个元素，在子单词层面上进行重复编码时需要考虑最大长度参数 $dup\_len$ 其取值范围为从0到 $\max(2,\text{int}(dup\_rate * N))$ 随后通过均匀分布生成随机索引集 $dup\_set=\text{uniform}(range=[1,N],num=dup\_len)$ 最终得到重编码后的序列 $x^+$ 形式为 $x^+=[x_1,x_1,x_2,\dots,x_N]$

Momentum Contrast

MoCo

Experiment

Evaluation Setup

1-million sentences randomly drawn from English Wikipedia
7个STS任务上

Main Results

在STS-B development sets上获得的最好结果

在STS7个任务上的两相比较结果，均有提升啊

消融试验，两种提升方法融合在一起，大力出奇迹了

Ablation Study

对dropout rates、repetition rates、基于句子长度扩展的方法以及动量对比队列尺寸分别进行实验研究，在观察ESimCSE效果变化的同时建议深入分析相关文献。

阅读感官

对于ESimCSE系统而言，是否有类似的初始设置或参数值得探讨？通过引入额外的重复词是否能够缓解序列长度相关的影响？随后调整策略为在生成文本时增加词项重复度。这种修改后的新模型是否会表现出在序列长度差异不超过k时具有更好的性能？

https://arxiv.org/pdf/2109.04380.pdf

全部评论 (0)

还没有任何评论哟~

ESimCSE: Enhanced Sample Building Method for Contrastive Learning of Unsupervised Sentence Embedding

论文目的 SimCSE使用dropout作为数据增强的最小方法，因为transformer使用位置embedding，句子的长度信息会被编码到句子embedding中，所以unsupSimCSE的正对...

An Unsupervised Sentence Embedding Method by Mutual Information Maximization

背景知识互信息（Mutualinformation）指的是两个变量的联合分布与边缘分布之间的KL散度/相对熵（Kullback–Leiblerdivergenceorrelativeentropy）...

Fully Unsupervised Deepfake Video Detection via Enhanced Contrastive Learning

目录背景方法流程阶段1：伪标签生成器的建立阶段2：增强对比学习阶段3：二值分类&鉴定实验部分消融实验与先进的方法对比方法的泛化性来源：2024TPAMI（CCFA）作者：Tong...

CLEAR: Contrastive Learning for Sentence Representation

Abstract 大多数已有的预训练语言模型集中于wordlevel的训练目标，而sentencelevel的目标则很少被研究。我们提出ContrastiveLEArningforsentenceR...

SimCSE: Simple Contrastive Learning of Sentence Emb

SimCSE主要解决的是SentenceEmbedding的问题，也就是句向量。传统方式中，大部分句向量是通过词向量求和而成（词向量通常是由word2vec等方法训练而成）。显然这样的方法比较简单粗暴...

SimCSE: Simple Contrastive Learning of Sentence Embeddings

SimCSE 论文目的 SimCSE:simplecontrastivesentenceembeddingframework 首先提出一种无监督的方法，仅使用dropout作为噪声，进行对比训练。与有...

SimCSE: Simple Contrastive Learning of Sentence Embeddings

Abstract SimCSE,aSimpleContrastiveSentenceEmbeddingframework 一种无监督方法：输入一个句子，并在一个对比学习目标下预测它自身，仅使用标准的d...

TPAMI-2024-Fully Unsupervised Deepfake Video Detection Via Enhanced Contrastive Learning

一、研究背景 1.现有deepfake方法依赖于准确的标签监督，因此受限于标签数量或标签攻击。 2.现有无监督任务仍需要部分标注：利用无标注数据进行模型预训练，利用有标签数据微调分类器（类别需要标注）...

Unsupervised hard Negative Augmentation for contrastive learning

Q:这篇论文试图解决什么问题？ A:这篇论文试图解决的问题是在自监督对比学习（SelfsupervisedContrastiveLearning,SSCL）中，如何有效地利用负样本来提高模型在语义文本...

21-ICLR-Prototypical Contrastive Learning of Unsupervised Representations

对比学习 PCL（PrototypicalContrastiveLearning）对比学习摘要 Motivation 实现摘要本文提出了原型对比学习，连接了对比学习和聚类的无监督表示学习方法。...

是否确定退出登录?

ESimCSE: Enhanced Sample Building Method for Contrastive Learning of Unsupervised Sentence Embedding

论文目的

相关工作

Proposed ESimCSE: Enhanced unsup-SimCSE

Word Repetition

Momentum Contrast

Experiment

Evaluation Setup

Main Results

Ablation Study

阅读感官

全部评论 (0)

相关文章推荐

ESimCSE: Enhanced Sample Building Method for Contrastive Learning of Unsupervised Sentence Embedding

An Unsupervised Sentence Embedding Method by Mutual Information Maximization

Fully Unsupervised Deepfake Video Detection via Enhanced Contrastive Learning

CLEAR: Contrastive Learning for Sentence Representation

SimCSE: Simple Contrastive Learning of Sentence Emb

SimCSE: Simple Contrastive Learning of Sentence Embeddings

SimCSE: Simple Contrastive Learning of Sentence Embeddings

TPAMI-2024-Fully Unsupervised Deepfake Video Detection Via Enhanced Contrastive Learning

Unsupervised hard Negative Augmentation for contrastive learning

21-ICLR-Prototypical Contrastive Learning of Unsupervised Representations