Advertisement

半监督学习:MixMatch

阅读量:

该算法的整体流程较为直观简洁,在实现过程中主要采用了Mixup技术进行数据增强处理。具体而言,在实验设计中我们设定以下参数:将批量大小设定为B、标签样本定义为X、无标签样本定义为U、温度参数设置为T,并将无标签样本的数据增强次数设定为其增强次数K=2。需要注意的是,在本实验中所指的"这里的普通数据增强"特指非Mixup方式的数据增强方法。

二、
对一个batch中的X进行一次数据增强,得到

在这里插入图片描述

对一个batch中的U进行K次数据增强,得到

在这里插入图片描述

第三步是对所有的增强后无标签样本生成预测结果,并对这些预测结果取平均值;随后利用温度参数进行 sharpen 处理以获得最终猜测标签

在这里插入图片描述

。**

在这里插入图片描述

通过增强技术获得的是带有高质量标注的带标签的数据集及其对应的真实标签;同时,在未标记的数据样本中也被应用了同样的方法,并根据模型预测得到了相应的猜测结果。

在这里插入图片描述

五、将有标签数据和无标签数据cat并shuffle得到W。

六、采用增强后的带标签数据与样本W实施mixup策略; 基于增强后的无标签样本与样本W应用mixup方法。

算法流程

七、损失函数
模型参数包括温度T、数据增强次数K以及mixup中的beta分布参数alpha。
该损失函数由带标签的数据集lossx(交叉熵损失)和无监督学习样本lossu(欧氏距离平方损失)组成,并通过加权平均的方式结合在一起用于优化模型参数。

在这里插入图片描述

参数结合得到总的Loss。**

在这里插入图片描述

全部评论 (0)

还没有任何评论哟~