编程 Python

浅谈Pytorch torch.optim优化器个性化的使用

Posted in Python onFebruary 20, 2020

一、简化前馈网络LeNet

import torch as t
 
 
class LeNet(t.nn.Module):
 def __init__(self):
  super(LeNet, self).__init__()
  self.features = t.nn.Sequential(
   t.nn.Conv2d(3, 6, 5),
   t.nn.ReLU(),
   t.nn.MaxPool2d(2, 2),
   t.nn.Conv2d(6, 16, 5),
   t.nn.ReLU(),
   t.nn.MaxPool2d(2, 2)
  )
  # 由于调整shape并不是一个class层，
  # 所以在涉及这种操作（非nn.Module操作）需要拆分为多个模型
  self.classifiter = t.nn.Sequential(
   t.nn.Linear(16*5*5, 120),
   t.nn.ReLU(),
   t.nn.Linear(120, 84),
   t.nn.ReLU(),
   t.nn.Linear(84, 10)
  )
 
 def forward(self, x):
  x = self.features(x)
  x = x.view(-1, 16*5*5)
  x = self.classifiter(x)
  return x
 
net = LeNet()

二、优化器基本使用方法

建立优化器实例

循环：

清空梯度

向前传播

计算Loss

反向传播

更新参数

from torch import optim
 
# 通常的step优化过程
optimizer = optim.SGD(params=net.parameters(), lr=1)
optimizer.zero_grad() # net.zero_grad()
 
input_ = t.autograd.Variable(t.randn(1, 3, 32, 32))
output = net(input_)
output.backward(output)
 
optimizer.step()

三、网络模块参数定制

为不同的子网络参数不同的学习率，finetune常用，使分类器学习率参数更高，学习速度更快（理论上）。

1.经由构建网络时划分好的模组进行学习率设定，

# # 直接对不同的网络模块制定不同学习率
optimizer = optim.SGD([{'params': net.features.parameters()}, # 默认lr是1e-5
      {'params': net.classifiter.parameters(), 'lr': 1e-2}], lr=1e-5)

2.以网络层对象为单位进行分组，并设定学习率

# # 以层为单位，为不同层指定不同的学习率
# ## 提取指定层对象
special_layers = t.nn.ModuleList([net.classifiter[0], net.classifiter[3]])
# ## 获取指定层参数id
special_layers_params = list(map(id, special_layers.parameters()))
print(special_layers_params)
# ## 获取非指定层的参数id
base_params = filter(lambda p: id(p) not in special_layers_params, net.parameters())
optimizer = t.optim.SGD([{'params': base_params},
       {'params': special_layers.parameters(), 'lr': 0.01}], lr=0.001)

四、在训练中动态的调整学习率

'''调整学习率'''
# 新建optimizer或者修改optimizer.params_groups对应的学习率
# # 新建optimizer更简单也更推荐，optimizer十分轻量级，所以开销很小
# # 但是新的优化器会初始化动量等状态信息，这对于使用动量的优化器（momentum参数的sgd）可能会造成收敛中的震荡
# ## optimizer.param_groups:长度2的list，optimizer.param_groups[0]：长度6的字典
print(optimizer.param_groups[0]['lr'])
old_lr = 0.1
optimizer = optim.SGD([{'params': net.features.parameters()},
      {'params': net.classifiter.parameters(), 'lr': old_lr*0.1}], lr=1e-5)

可以看到optimizer.param_groups结构，[{'params','lr', 'momentum', 'dampening', 'weight_decay', 'nesterov'},{……}]，集合了优化器的各项参数。

重写sgd优化器

import torch
from torch.optim.optimizer import Optimizer, required

class SGD(Optimizer):
 def __init__(self, params, lr=required, momentum=0, dampening=0, weight_decay1=0, weight_decay2=0, nesterov=False):
  defaults = dict(lr=lr, momentum=momentum, dampening=dampening,
      weight_decay1=weight_decay1, weight_decay2=weight_decay2, nesterov=nesterov)
  if nesterov and (momentum <= 0 or dampening != 0):
   raise ValueError("Nesterov momentum requires a momentum and zero dampening")
  super(SGD, self).__init__(params, defaults)

 def __setstate__(self, state):
  super(SGD, self).__setstate__(state)
  for group in self.param_groups:
   group.setdefault('nesterov', False)

 def step(self, closure=None):
  """Performs a single optimization step. Arguments: closure (callable, optional): A closure that reevaluates the model and returns the loss. """
  loss = None
  if closure is not None:
   loss = closure()

  for group in self.param_groups:
   weight_decay1 = group['weight_decay1']
   weight_decay2 = group['weight_decay2']
   momentum = group['momentum']
   dampening = group['dampening']
   nesterov = group['nesterov']

   for p in group['params']:
    if p.grad is None:
     continue
    d_p = p.grad.data
    if weight_decay1 != 0:
     d_p.add_(weight_decay1, torch.sign(p.data))
    if weight_decay2 != 0:
     d_p.add_(weight_decay2, p.data)
    if momentum != 0:
     param_state = self.state[p]
     if 'momentum_buffer' not in param_state:
      buf = param_state['momentum_buffer'] = torch.zeros_like(p.data)
      buf.mul_(momentum).add_(d_p)
     else:
      buf = param_state['momentum_buffer']
      buf.mul_(momentum).add_(1 - dampening, d_p)
     if nesterov:
      d_p = d_p.add(momentum, buf)
     else:
      d_p = buf

    p.data.add_(-group['lr'], d_p)

  return loss

以上这篇浅谈Pytorch torch.optim优化器个性化的使用就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

浅谈Pytorch torch.optim优化器个性化的使用

- Author -

小河沟大河沟

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

用Python编写一个简单的Lisp解释器的教程

Apr 03 Python

scrapy自定义pipeline类实现将采集数据保存到mongodb的方法

Apr 16 Python

Python中模块string.py详解

Mar 12 Python

轻松理解Python 中的 descriptor

Sep 15 Python

python使用tkinter实现简单计算器

Jan 30 Python

为什么选择python编程语言入门黑客攻防给你几个理由!

Feb 02 Python

TensorFlow模型保存/载入的两种方法

Mar 08 Python

DataFrame中去除指定列为空的行方法

Apr 08 Python

python的pyecharts绘制各种图表详细（附代码）

Nov 11 Python

Python开发之基于模板匹配的信用卡数字识别功能

Jan 13 Python

Python+Dlib+Opencv实现人脸采集并表情判别功能的代码

Jul 01 Python

Pycharm plot独立窗口显示的操作

Dec 11 Python

关于torch.optim的灵活使用详解(包括重写SGD,加上L1正则)

Feb 20 #Python

Python sys模块常用方法解析

Feb 20 #Python

pytorch 实现在一个优化器中设置多个网络参数的例子

Feb 20 #Python

pytorch ImageFolder的覆写实例

Feb 20 #Python

pytorch torchvision.ImageFolder的用法介绍

Feb 20 #Python

详解python常用命令行选项与环境变量

Feb 20 #Python

用什么库写 Python 命令行程序(示例代码详解)

Feb 20 #Python

You might like

Erlang的运算符(比较运算符,数值运算符,移位运算符,逻辑运算符)

2012/07/23 PHP

checkbox全选/取消全选以及checkbox遍历jQuery实现代码

2009/12/02 Javascript

自己使用js/jquery写的一个定制对话框控件

2014/05/02 Javascript

nodejs获取本机内网和外网ip地址的实现代码

2014/06/01 NodeJs

javascript设计模式之解释器模式详解

2014/06/05 Javascript

js实现一个链接打开两个链接地址的方法

2015/05/12 Javascript

js实现发送验证码后的倒计时功能

2015/05/28 Javascript

jquery插件EasyUI中form表单提交实例分享

2016/01/11 Javascript

jQuery easyUI datagrid 增加求和统计行的实现代码

2016/06/01 Javascript

Jquery 整理元素选取、常用方法一览表

2016/11/26 Javascript

AngularJs篇：使用AngularJs打造一个简易权限系统的实现代码

2016/12/26 Javascript

原生js实现倒计时功能（多种格式调用）

2017/01/12 Javascript

AngularJS页面传参的5种方式

2017/04/01 Javascript

基于vue打包后字体和图片资源失效问题的解决方法

2018/03/06 Javascript

详解a标签添加onclick事件的几种方式

2019/03/29 Javascript

Vue组件实现触底判断

2019/06/26 Javascript

vue获取data数据改变前后的值方法

2019/11/07 Javascript

基于小程序请求接口wx.request封装的类axios请求

2020/07/02 Javascript

解决antd日期选择组件,添加value就无法点击下一年和下一月问题

2020/10/29 Javascript

Python import用法以及与from...import的区别

2015/05/28 Python

python高手之路python处理excel文件(方法汇总)

2016/01/07 Python

使用python 打开文件并做匹配处理的实例

2019/01/02 Python

python字符串反转的四种方法详解

2019/12/02 Python

pytorch .detach() .detach_() 和 .data用于切断反向传播的实现

2019/12/27 Python

PyTorch 普通卷积和空洞卷积实例

2020/01/07 Python

浅谈python的elementtree模块处理中文注意事项

2020/03/06 Python

Django模板获取field的verbose_name实例

2020/05/19 Python

远程调用的原理

2014/07/05 面试题

大学社团计划书

2014/05/01 职场文书

消防宣传口号

2014/06/16 职场文书

音乐幼师求职信

2014/07/09 职场文书

岗位安全生产责任书

2014/07/28 职场文书

2014年医院党建工作总结

2014/12/20 职场文书

2015中学学校工作总结

2015/07/20 职场文书

python控制台打印log输出重复的解决方法

2021/05/14 Python

Windows11里微软已经将驱动程序安装位置A盘删除

2021/11/21 数码科技