Advertisement

Pick-a-Pic:An open dataset of user preferences for text-to-image generation

阅读量:

introduction

构建了一个数据集,在每个示例中包含一个提示、两个生成的图像以及一个用于指明首选图片位置的标签;当无法判断哪个图片更优时,则将这种情况标记为平局。该数据集由真实用户参与创建,并包含了50万个这样的示例。

通过真实用户的偏好应用来训练一个评分函数,并利用人类偏好数据结合类似InstructGPT的奖励模型目标来进行对clip-H的微调

2.Pick-a-Pic Dataset

该数据集包含了超过50万个示例,并提供了35,000种不同的提示方案。每个示例都附带一个提示词,并带有相应的标签信息。此外,在数据集中使用的每一个图像都是通过多个文生图模型进行生成的。

数据主要来自真实用户的反馈,并非依赖于人工标注的数据。总计获得了968,965项排序结果(其中包括两个阶段的数据),这些排序结果源自多个不同的来源:每个排序结果对应一个提示和一个用户的组合。Pick-a-Pic数据集包含大量高质量的训练样本(包含多个不同的子类),其中包含大量高质量的图像配对实例以及丰富的分类标记信息。该集合由来自不同背景的4,375名用户提供的各自提交组成

3.PickScore

在pick-a-pic训练集上对clip-H进行微调训练,在此过程中进行了约4,000次迭代运算,并设置学习率为3×1e-6(即3e-6),批量大小设定为128。完成全部任务所需时间不足一小时。

全部评论 (0)

还没有任何评论哟~