深度学习学习率的研究

阅读量：

一.是通过人为经验进行设定，如到达多少轮后，设定具体的学习率为多少

分段常数衰减
分段常数衰减是在事先定义好的训练次数区间上，设置不同的学习率常数。刚开始学习率大一些，之后越来越小，区间的设置需要根据样本量调整，一般样本量越大区间间隔应该越小。
tf.train.piecewise_constant(
x,
boundaries,
values,
name=None
)
x: 标量，指代训练次数
boundaries：学习率参数应用区间列表
values：学习率列表，values的长度比boundaries的长度多一个
name：操作的名称
boundaries = [10, 20, 30] （分三段，然后设置四个不同的学习速率）
learing_rates = [0.1, 0.07, 0.025, 0.0125]
分段常数衰减可以让调试人员针对不同任务设置不同的学习率，进行精细调参，要求调试人员对模型和数据集有深刻认识，要求较高。
在这里插入图片描述

二.是随着迭代轮数的增加学习率自动发生衰减，这类有比较常用的指数型衰退

1.指数衰减
指数衰减是比较常用的衰减方法，学习率是跟当前的训练轮次指数相关的。
计算公式是：
decayed_learning_rate = learning_rate *
decay_rate ^ (global_step / decay_steps)
tf.train.exponential_decay(
learning_rate,
global_step,
decay_steps,
decay_rate,
staircase=False,
name=None
)
learning_rate: 初始学习率
global_step: 当前训练轮次，epoch
decay_step: 定义衰减周期，跟参数staircase配合，可以在decay_step个训练轮次内保持学习率不变
decay_rate，衰减率系数
staircase：定义是否是阶梯型衰减，还是连续衰减，默认是False，即连续衰减（标准的指数型衰减）
name：操作名称
在这里插入图片描述
2.自然指数衰减
计算公式是：
decayed_learning_rate = learning_rate * exp(-decay_rate * global_step)
tf.train.natural_exp_decay(
learning_rate,
global_step,
decay_steps,
decay_rate,
staircase=False,
name=None
)
learning_rate: 初始学习率
global_step: 当前训练轮次，epoch
decay_step: 定义衰减周期，跟参数staircase配合，可以在decay_step个训练轮次内保持学习率不变
decay_rate，衰减率系数
staircase：定义是否是阶梯型衰减，还是连续衰减，默认是False，即连续衰减（标准的指数型衰减）
name：操作名称
在这里插入图片描述 2.多项式衰减
多项式衰减是这样一种衰减机制：定义一个初始的学习率，一个最低的学习率，按照设置的衰减规则，学习率从初始学习率逐渐降低到最低的学习率，并且可以定义学习率降低到最低的学习率之后，是一直保持使用这个最低的学习率，还是到达最低的学习率之后再升高学习率到一定值，然后再降低到最低的学习率（反复这个过程）。
tf.train.polynomial_decay(
learning_rate,
global_step,
decay_steps,
end_learning_rate=0.0001,
power=1.0,
cycle=False,
name=None
)
learning_rate: 初始学习率
global_step: 当前训练轮次，epoch
decay_step: 定义衰减周期
end_learning_rate：最小的学习率，默认值是0.0001
power：多项式的幂，默认值是1,即线性的
cycle：定义学习率是否到达最低学习率后升高，然后再降低，默认False，保持最低学习率
name：操作名称
多项式衰减的学习率计算公式：
global_step = min(global_step, decay_steps)
decayed_learning_rate = (learning_rate - end_learning_rate) * (1 - global_step / decay_steps) ^ (power) +end_learning_rate
如果定义 cycle为True，学习率在到达最低学习率后往复升高降低，此时学习率计算公式为：
decay_steps = decay_steps * ceil(global_step / decay_steps)
decayed_learning_rate = (learning_rate - end_learning_rate) *(1 - global_step / decay_steps) ^ (power) + end_learning_rate
在这里插入图片描述

全部评论 (0)

还没有任何评论哟~

深度学习学习率的研究

一.是通过人为经验进行设定，如到达多少轮后，设定具体的学习率为多少分段常数衰减分段常数衰减是在事先定义好的训练次数区间上，设置不同的学习率常数。刚开始学习率大一些，之后越来越小，区间的设置需要根据...

深入研究深度学习

介绍随着我们进入人工智能AI时代，一个引人注目的术语就是深度学习。深度学习是第四次工业革命的先驱，已成为人工智能领域的关键，为计算机视觉、自然语言处理和自动驾驶汽车等技术提供动力。但深度学习到底是什...

研究生研一学习机器学习ML、深度学习DL的规划

研究生学习机器学习ML、深度学习DL的规划保上研之后也没有很好规划自己的学习路线，看到b站上的一位清华博士讲述他本科也是机械，跨考计算机后的学习路线，所以记录下来，从现在开始按照规划来一点一点地做好...

深度学习研究和进展

1.研究背景和理论基础 1958年，Rosenblatt提出感知机模型（ANN） 1986年，Hinton提出多隐层构造深层神经网络（MNN） 2006年，Hinton提出深度置信网络（DBN），成为...

关于深度学习的研究综述

来源作者：曹阳多伦多大学的神经网络专家GeoffreyHinton[2]等人于2006年首次提出了深度学习的概念，从此拉开了深度学习研究和应用的序幕。近些年来，深度学习引起了计算机视觉、搜索技术、自...

深度学习目前的研究方向

根据20122017年被引用最多的深度学习论文,深度学习目前的研究方向如下: 1、基础性的理解和概括 2、优化训练 3、卷积神经网络模型研究 4、图像：分割/目标检测 5、视频 6、自然语言处理 7、...

深度学习在哲学研究中的应用

好的,根据您的要求,我将以《深度学习在哲学研究中的应用》为主题,写一篇专业的技术博客文章。 1\.背景介绍 1.1哲学的发展与挑战哲学作为人类探索世界、了解自身的重要途径,在漫长的历史长河中不断地推...

深度学习视觉研究综述

深度学习视觉研究综述一、引言深度学习（DeepLearning）自2012年AlexNet在ImageNet竞赛中突破性表现以来，彻底改变了计算机视觉（ComputerVision,CV）领域。 ...

深度学习之LSTM原理研究

文章目录 LSTM来源 LSTM网络公式解释遗忘门的计算输入门的计算输出门的计算内部状态ct的计算输出ht的计算总结展望 LSTM来源因为论文里面用到了LSTM网络，又不想看代码，遂记...

深度学习之学习率

1学习率 1.1学习率的作用在机器学习中，监督式学习通过定义一个模型，并根据训练集上的数据估计最优参数。梯度下降法是一个广泛被用来最小化模型误差的参数优化算法。梯度下降法通过多次迭代，并在每一步中...

是否确定退出登录?

深度学习学习率的研究

一.是通过人为经验进行设定，如到达多少轮后，设定具体的学习率为多少

二.是随着迭代轮数的增加学习率自动发生衰减，这类有比较常用的指数型衰退

全部评论 (0)

相关文章推荐

深度学习学习率的研究

深入研究深度学习

研究生研一学习机器学习ML、深度学习DL的规划

深度学习研究和进展

关于深度学习的研究综述

深度学习目前的研究方向

深度学习在哲学研究中的应用

深度学习视觉研究综述

深度学习之LSTM原理研究

深度学习之学习率