Advertisement

Zero-shot, One-shot和Few-shot的理解

阅读量:

目录

一、传统监督式学习

二、Zero-shot learning (零样本学习,简称ZSL)

三、Few-shot learning

3.1 什么是Meta

3.2 什么是Meta Learning?

3.3 Few-shot learning

四、One-shot learning


机器学习任务根据对样本量的需求可以划分为:基于传统监督的学习方法、基于少样本的学习方法、基于单样本的学习方法以及零样本的学习方法。

一、传统监督式学习

传统深度学习的学习效率较低。通常需要通过大量数据进行训练,并采用炼丹模式才能使模型具备较强的泛化能力。具体表现为:一是通过大量数据进行训练;二是采用炼丹模式。

为了 系统性地开展研究 旨在实现 '高效便捷 快速稳定 可靠可扩展' 的目标路径 进行 Zero-shot Learning / One-shot Learning / Few-shot Learning 的探索

二、Zero-shot learning (零样本学习,简称ZSL)

任务定义:

基于训练数据集合构建模型,在这一过程中需通过类别特征信息建立起两类别之间的关联关系;由于两类别完全不重合,在这一过程中需通过类别特征信息建立起两类别之间的关联关系;最终实现了分类效果的良好表现

零样本学习旨在让我们的模型能够对其从未见过的类别进行分类,并赋予机器推理能力以实现真正的智能化。其中一项技术称为‘零次’(Zero-shot)技术,它指的是完全不进行任何学习训练的情况。

如果我们的模型已经能够识别出马、老虎和熊猫等动物种类了,那么为了使该模型也能识别出斑马这一物种,则需要对模型进行相应的训练与指导。具体而言,在训练过程中不仅要告诉模型哪些图片中的物体属于斑马这一类别,并且还需要明确定义斑马的对象特征是什么样的;然而需要注意的是,在当前阶段我们无法直接向模型展示斑马图像(即无法直接让其看到真实的斑马),因此我们需要将注意力集中在前三类动物(即马、老虎和熊猫)的相关样本信息上,并结合这些样本所对应的类别标签以及这些动物的独特特征描述来进行训练与指导工作)。

三、Few-shot learning

作为元学习范畴中的一个典型代表,少样本学习机制在机器学习领域具有重要的应用价值。为了深入解析少样本学习的本质内涵,我们需先打牢元学习的基本理论基础。值得注意的是,在系统掌握元学习相关知识体系之前,我们需要先明晰元的概念基础。

3.1 什么是Meta

meta就是描述数据的数据。

例如图片显示出来的数据是Data。但其中不仅包含镜头光圈设置的信息和快门时间长短的信息,并且还有相机品牌型号的信息。

————————————————

3.2 什么是Meta Learning?

通常情况下,机器学习模型需要较大的训练集样本量以获得较好的预测效果。然而,在人类中则无需如此。对于从未见过猫和狗的小朋友而言,在他们面前展示多张照片后就能轻易学会识别这两种动物。如果一个人已经熟练掌握了自行车骑行技巧,则学习摩托车骑行对他而言将异常容易。我们是否能够设计出一种机制或模型,在仅凭少量训练数据的情况下就能自主获取并掌握新的知识?换句话说,能否让模型具备自我学习的能力?

举个例子, 一个小朋友去动物园, 动物园里有一些动物他从未见过, 所以也不清楚它们的名字. 然后你给他一些小卡片, 卡片上标注着各类动物的照片及其名称, 小朋友就可以通过观察这些图片来认识新事物. 从这些卡片里, 他能够自主识别出这些动物的名字. 这里的未知物种我们称之为Query, 而这张标有照片的小卡则被称为Support Set. 培养孩子通过小卡进行自主学习的方法即被称作Meta Learning. 如果某个物种仅有单一的一张小卡供参考, 那么这种情形则被称为One-Shot Learning.

小规模带标签的数据集被称为Support Set,在这种情况下由于其样本数量有限而导致无法充分训练一个神经网络。相比之下,在Training Set中每个类别都拥有充足的样本数量,并且基于Training Set构建的模型在Test Set上能够展现出良好的Generalization Performance

————————————————

Meta learning属于一种基于其他机器学习任务的结果进行优化以提升模型泛化能力的机器学习算法;一旦掌握了meta data的概念,则对理解 meta learning 会更加容易。

机器学习算法通过历史数据获取相关知识,并推广到未知的数据样本。

Learning Algorithm: be guided by historical data to predict outcomes based on new instances.

meta learning是基于other learning algorithms (learning algorithm)的输出进行学习的过程;这也就意味着这些other learning algorithms以及被预先训练过(即经过预先训练)。具体而言,meta learning algorithm将其他机器学习算法的输出作为输入数据,并通过回归与分类技术来进行预测。

Meta Learning Algorithm: Draw upon the results of learning algorithms to predict outcomes based on predictions generated by other models.

如果说机器学习(ML)是一种使用信息来进行预测的技术,并且能够生成更准确的结果;那么元学习(Meta Learning)就是一种能够利用现有的ML模型进行训练和优化的技术,并且能够生成最准确的预测结果。

3.3 Few-shot learning

Few-shot learning指从少量标注样本中进行学习的一种思想。

Because of insufficient training data, few-shot learning cannot enable a model to "acquire" images, and thus generalize to the test set. Instead, it focuses on distinguishing the similarity between images. When applying few-shot learning to classification problems, it is termed few-shot classification; similarly, it can be applied to regression problems as well. Therefore, in this section, all mentioned few-shot learning methods are dedicated to addressing classification tasks.

假设我们有一个非常大的训练集,并且该训练集包括以下五个类别样本:其中包含哈士奇、大象、老虎以及金刚鹦鹉等动物性物种和汽车这一非生物性类别对象。我们的目标并非是要让模型识别出哪些是哈士奇或大象这类生物性物种;而是希望模型能够了解各类别之间的差异。

————————————————

四、One-shot learning

如果训练集中,不同类别的样本只有一个,则成为One-shot learning.

One-shot learning is a special case of few-shot learning. 企业利用人脸识别技术开发了一种创新的人脸识别系统。只需提交一张识别照片即可完成身份验证。这一系统能够识别到不同姿态下的您。这一技术正是基于一比照(one-shot)实现的。

全部评论 (0)

还没有任何评论哟~