MAML:Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

阅读量：

元学习的目标是在各种学习任务上训练一个可以仅仅使用少量训练样本就可以解决新任务的模型，在本文中，模型的参数训练很明确，所以从新任务的少量样本做几步梯度下降就可以在新任务上得到好的泛化性。同时，由于模型可应用于一系列使用梯度下降训练的模型，包括分类，回归，强化学习等等，所以也叫作模型无关的模型。
本文的关键思想在于训练模型的初始参数，使得模型的参数在某个新任务上仅适用少量样本经过一步或者几步梯度下降更新后就可以早新任务上有很好的表现。从特征学习的角度来看，这是一个建立适应多种任务的内部特征表达的过程，使得其可以更容易，更快速的fine-tune；从动态系统的角度来看，学习过程可以被看做是最大化loss function对于和新任务有关的参数的敏感度，当敏感度高时，参数的小的局部改变可以使loss得到巨大的提高。

模型

任务设定

考虑一个模型，用 $\mathcal{f}$ 表示，将观察值x映射到输出a上。在元学习过程中，模型被训练以适应于大量或无限的任务。任务可以形式化地定义如下，
$\mathcal{T} = \{\mathcal{L}(x_1,a_1,...,x_H,a_h),q(x_1),q(x_{t+1}|x_t,a_t),H\}$
由损失函数 $\mathcal{L}$ ，基于初始观察值的分布 $q(x_1)$ ，一个transition分布 $q(x_{t+1}|x_t,a_t)$ ，eposide length H组成。
对于模型要适应的任务分布 $p(\mathcal{T})$ ，在K-shot learning的设定下，模型从 $p(\mathcal{T})$ 采样任务 $\mathcal{T}_i$ ，再从 $q_i$ 中采样K个样本，产生由 $\mathcal{T}$ 产生的反馈 $\mathcal{L_{T_i}}$ 。在K个样本上训练，然后在 $\mathcal{T}_i$ 的新样本上进行测试。然后，通过考虑新样本的测试误差改变相应的参数以提升模型效果，实际上，在元学习过程中，这个测试误差被当做是训练误差。

算法

在这里插入图片描述
在学习过程中，一些特征比其他的更具有迁移性。比如，一个神经网络可能学到广泛适应于 $p(\mathcal{T})$ 中所有任务内部特征，而不是对于某个单独的任务。为了提取这种更具有一般性的特征，在新任务上使用基于梯度下降的fine-tune的方式去训练模型。实际上，我们希望找到对于任务改变敏感的参数。
在这里插入图片描述
形式上，考虑参数为 $\theta$ 的函数 $f_\theta$ 表示的模型，当在新任务 $\mathcal{T}_i$ 执行一步或者几步梯度下降后，模型的参数变成了 $\theta\prime$ ,当执行一步梯度更新时，
$\theta_i\prime=\theta-\alpha\nabla_\theta\mathcal{L_{T_i}}f(\theta)$
模型的参数通过从与 $\theta$ 对应的 $p(\mathcal{T})$ 中采样的所有任务对应的 $f_{\theta_i\prime}$ 进行优化，
$\min_\theta \sum_{\mathcal{L}_i\sim p(\mathcal{T})}\mathcal{L_{T_i}}(f_{\theta_i\prime}) = \sum_{\mathcal{L}_i\sim p(\mathcal{T})}L(f_{\theta-\alpha\nabla_\theta\mathcal{L_{T_i}}f(\theta)})$
需要注意的是元优化过程是针对模型参数 $\theta$ 的，但是是通过更新后的参数 $\theta\prime$ 计算的。在任务间的优化通过SGD，所以参数更新后，
$\theta\leftarrow\theta-\beta\nabla_\theta\sum_{\mathcal{L}_i\sim p(\mathcal{T})}\mathcal{L_{T_i}}(f_{\theta_i\prime})$
MAML的梯度计算包含二阶导数，计算时，需要额外的反向传播来计算海瑟矩阵。本文中，同时实验了不进行这次反向传播，使用一阶导近似的情况，最终准确度是差不多的。说明了MAML的大部分提升来自于基于任务目标优化得到的梯度，而不是通过梯度的二次微分

分类或者回归问题

对于分类问题，使用交叉熵损失函数
对于回归问题，使用MSE

实验

全部评论 (0)

还没有任何评论哟~

MAML:Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

元学习的目标是在各种学习任务上训练一个可以仅仅使用少量训练样本就可以解决新任务的模型，在本文中，模型的参数训练很明确，所以从新任务的少量样本做几步梯度下降就可以在新任务上得到好的泛化性。同时，由于模型...

Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks 读后感

ModelAgnosticMetaLearningforFastAdaptationofDeepNetworks读后感）论文概述什么是元学习 Algorithm1ModelAgnosticMeta...

论文阅读：Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

论文地址：<https://arxiv.org/abs/1703.03400 代码：<https://github.com/cbfinn/maml 发表：ICML2017 假设图里面，Task1,Ta...

Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks Chelsea 论文笔记

前言本文提出了一种元学习算法，它与模型无关并且通用性很强，可以直接应用到各种由梯度下降训练的模型上，并且适用于很多学习问题，包括分类，回归和强化学习。本文提出的算法的关键思想是训练模型的初始化参数，...

《Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks》论文翻译笔记

元学习系列文章 1.optimizationbasedmetalearning 1.《ModelAgnosticMetaLearningforFastAdaptationofDeepNetworks》...

小样本学习论文--Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

文章目录一、前言二、论文解读 1、概述 2、主要内容 2.1问题设定 2.2与模型无关的元学习算法三、代码解析 1、抽取数据 2、MAML 3、训练过程一、前言学过深度学习的同学都应该知道，...

理解MAML：Model-Agnostic Meta-Learning for Fast Adaption of Deep Networks

论文：ModelAgnosticMetaLearningforFastAdaptationofDeepNetworksarXiv:1703.03400v3[cs.LG]18Jul2017 MAML解决...

MAML: Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks (模型无关的元学习用于快速适应深度网络)

目录 1\.摘要 2\.介绍 2\.算法 2.1问题设置 2.2算法 3\.个人理解 3.1学习过程： 3.2初始化 4\.其他 5\.论文链接 1\.摘要文章提出了一种新的元学习Metalearn...

CAML: FAST CONTEXT ADAPTATION VIA META-LEARNING

本文同样以MAML为基础，与MAML不同的是，MAML在每个新任务上会更新所有的参数，而CAML将模型的参数分成了两部分，一部分是contextparameters，作为模型的额外输入使其适应于单独的...

ECCV2020 元学习SR Fast Adaptation to Super-Resolution Networks via Meta-Learning

文章地址：<https://www.ecva.net/papers/eccv2020/papersECCV/papers/123720749.pdf 项目地址（待开源）：<https://github...

是否确定退出登录?

MAML:Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

模型

任务设定

算法

分类或者回归问题

实验

全部评论 (0)

相关文章推荐

MAML:Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks 读后感

论文阅读：Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks Chelsea 论文笔记

《Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks》 论文翻译笔记

小样本学习论文--Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

理解MAML：Model-Agnostic Meta-Learning for Fast Adaption of Deep Networks

MAML: Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks (模型无关的元学习用于快速适应深度网络)

CAML: FAST CONTEXT ADAPTATION VIA META-LEARNING

ECCV2020 元学习SR Fast Adaptation to Super-Resolution Networks via Meta-Learning

《Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks》论文翻译笔记