Keras SGD 随机梯度下降优化器参数设置方式


Posted in Python onJune 19, 2020

SGD 随机梯度下降

Keras 中包含了各式优化器供我们使用,但通常我会倾向于使用 SGD 验证模型能否快速收敛,然后调整不同的学习速率看看模型最后的性能,然后再尝试使用其他优化器。

Keras 中文文档中对 SGD 的描述如下:

keras.optimizers.SGD(lr=0.01, momentum=0.0, decay=0.0, nesterov=False)

随机梯度下降法,支持动量参数,支持学习衰减率,支持Nesterov动量

参数:

lr:大或等于0的浮点数,学习率

momentum:大或等于0的浮点数,动量参数

decay:大或等于0的浮点数,每次更新后的学习率衰减值

nesterov:布尔值,确定是否使用Nesterov动量

参数设置

Time-Based Learning Rate Schedule

Keras 已经内置了一个基于时间的学习速率调整表,并通过上述参数中的 decay 来实现,学习速率的调整公式如下:

LearningRate = LearningRate * 1/(1 + decay * epoch)

当我们初始化参数为:

LearningRate = 0.1
decay = 0.001

大致变化曲线如下(非实际曲线,仅示意):

Keras SGD 随机梯度下降优化器参数设置方式

当然,方便起见,我们可以将优化器设置如下,使其学习速率随着训练轮次变化:

sgd = SGD(lr=learning_rate, decay=learning_rate/nb_epoch, momentum=0.9, nesterov=True)

Drop-Based Learning Rate Schedule

另外一种学习速率的调整方法思路是保持一个恒定学习速率一段时间后立即降低,是一种突变的方式。通常整个变化趋势为指数形式。

Keras SGD 随机梯度下降优化器参数设置方式

对应的学习速率变化公式如下:

LearningRate = InitialLearningRate * DropRate^floor(Epoch / EpochDrop)

实现需要使用 Keras 中的 LearningRateScheduler 模块:

from keras.callbacks import LearningRateScheduler
# learning rate schedule
def step_decay(epoch):
 initial_lrate = 0.1
 drop = 0.5
 epochs_drop = 10.0
 lrate = initial_lrate * math.pow(drop, math.floor((1+epoch)/epochs_drop))
 return lrate

lrate = LearningRateScheduler(step_decay)

# Compile model
sgd = SGD(lr=0.0, momentum=0.9, decay=0.0, nesterov=False)
model.compile(loss=..., optimizer=sgd, metrics=['accuracy'])

# Fit the model
model.fit(X, Y, ..., callbacks=[lrate])

补充知识:keras中的BGD和SGD

关于BGD和SGD

首先BGD为批梯度下降,即所有样本计算完毕后才进行梯度更新;而SGD为随机梯度下降,随机计算一次样本就进行梯度下降,所以速度快很多但容易陷入局部最优值。

折中的办法是采用小批的梯度下降,即把数据分成若干个批次,一批来进行一次梯度下降,减少随机性,计算量也不是很大。 mini-batch

keras中的batch_size就是小批梯度下降。

以上这篇Keras SGD 随机梯度下降优化器参数设置方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python 获取本机ip地址的两个方法
Feb 25 Python
Python中音频处理库pydub的使用教程
Jun 07 Python
Centos7 Python3下安装scrapy的详细步骤
Mar 15 Python
python批量复制图片到另一个文件夹
Sep 17 Python
Python3中bytes类型转换为str类型
Sep 27 Python
python  Django中的apps.py的目的是什么
Oct 15 Python
Django-Rest-Framework 权限管理源码浅析(小结)
Nov 12 Python
python单线程文件传输的实例(C/S)
Feb 13 Python
Python基础教程之if判断,while循环,循环嵌套
Apr 25 Python
django自定义模板标签过程解析
Dec 14 Python
tensorflow ckpt模型和pb模型获取节点名称,及ckpt转pb模型实例
Jan 21 Python
python boto和boto3操作bucket的示例
Oct 30 Python
python支持多继承吗
Jun 19 #Python
python和php哪个容易学
Jun 19 #Python
基于Keras中Conv1D和Conv2D的区别说明
Jun 19 #Python
Python魔术方法专题
Jun 19 #Python
关于Theano和Tensorflow多GPU使用问题
Jun 19 #Python
如何对python的字典进行排序
Jun 19 #Python
浅谈Python中的继承
Jun 19 #Python
You might like
PHP中for循环语句的几种变型
2006/11/26 PHP
用PHP读取超大文件的实例代码
2012/04/01 PHP
解析php函数method_exists()与is_callable()的区别
2013/06/21 PHP
解析php中获取url与物理路径的总结
2013/06/21 PHP
php的闭包(Closure)匿名函数详解
2015/02/22 PHP
Zend Framework开发入门经典教程
2016/03/23 PHP
利用PHP判断是手机移动端还是PC端访问的函数示例
2017/12/14 PHP
PHP7如何开启Opcode打造强悍性能详解
2018/05/11 PHP
解决thinkphp5未定义变量会抛出异常,页面错误,请稍后再试的问题
2019/10/16 PHP
PHP For循环字母A-Z当超过26个字母时输出AA,AB,AC
2020/02/16 PHP
Jquery $.getJSON 在IE下的缓存问题解决方法
2014/10/10 Javascript
jQuery实现简洁的轮播图效果实例
2016/09/07 Javascript
Vue自定义指令介绍(2)
2016/12/08 Javascript
vue  directive定义全局和局部指令及指令简写
2018/11/20 Javascript
浅谈Angular7 项目开发总结
2018/12/19 Javascript
JS实现带阴历的日历功能详解
2019/01/24 Javascript
简单学习5种处理Vue.js异常的方法
2019/06/17 Javascript
Vuex 模块化使用详解
2019/07/31 Javascript
JavaScript数组排序功能简单实现
2020/05/14 Javascript
python网络编程学习笔记(七):HTML和XHTML解析(HTMLParser、BeautifulSoup)
2014/06/09 Python
python实现在控制台输入密码不显示的方法
2015/07/02 Python
Python类的动态修改的实例方法
2017/03/24 Python
一个基于flask的web应用诞生 flask和mysql相连(4)
2017/04/11 Python
Python3列表List入门知识附实例
2020/02/09 Python
python编写一个会算账的脚本的示例代码
2020/06/02 Python
python和JavaScript哪个容易上手
2020/06/23 Python
Python drop方法删除列之inplace参数实例
2020/06/27 Python
Keras实现DenseNet结构操作
2020/07/06 Python
移动端html5模拟长按事件的实现方法
2018/09/30 HTML / CSS
Sneaker Studio波兰:购买运动鞋
2018/04/28 全球购物
什么是makefile? 如何编写makefile?
2013/01/02 面试题
机关干部作风整顿心得体会
2016/01/22 职场文书
2019年让高校“心动”的自荐信
2019/03/25 职场文书
MySQL系列之二 多实例配置
2021/07/02 MySQL
MySQL里面的子查询的基本使用
2021/08/02 MySQL
Python采集爬取京东商品信息和评论并存入MySQL
2022/04/12 Python