pytorch自定义初始化权重的方法


Posted in Python onAugust 17, 2019

在常见的pytorch代码中,我们见到的初始化方式都是调用init类对每层所有参数进行初始化。但是,有时我们有些特殊需求,比如用某一层的权重取优化其它层,或者手动指定某些权重的初始值。

核心思想就是构造和该层权重同一尺寸的矩阵去对该层权重赋值。但是,值得注意的是,pytorch中各层权重的数据类型是nn.Parameter,而不是Tensor或者Variable。

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
 
# 第一一个卷积层,我们可以看到它的权值是随机初始化的
w=torch.nn.Conv2d(2,2,3,padding=1)
print(w.weight)
 
 
# 第一种方法
print("1.使用另一个Conv层的权值")
q=torch.nn.Conv2d(2,2,3,padding=1) # 假设q代表一个训练好的卷积层
print(q.weight) # 可以看到q的权重和w是不同的
w.weight=q.weight # 把一个Conv层的权重赋值给另一个Conv层
print(w.weight)
 
# 第二种方法
print("2.使用来自Tensor的权值")
ones=torch.Tensor(np.ones([2,2,3,3])) # 先创建一个自定义权值的Tensor,这里为了方便将所有权值设为1
w.weight=torch.nn.Parameter(ones) # 把Tensor的值作为权值赋值给Conv层,这里需要先转为torch.nn.Parameter类型,否则将报错
print(w.weight)

附:Variable和Parameter的区别

Parameter 是torch.autograd.Variable的一个字类,常被用于Module的参数。例如权重和偏置。

Parameters和Modules一起使用的时候会有一些特殊的属性。parameters赋值给Module的属性的时候,它会被自动加到Module的参数列表中,即会出现在Parameter()迭代器中。将Varaible赋给Module的时候没有这样的属性。这可以在nn.Module的实现中详细看一下。这样做是为了保存模型的时候只保存权重偏置参数,不保存节点值。所以复写Variable加以区分。

另外一个不同是parameter不能设置volatile,而且require_grad默认设置为true。Varaible默认设置为False.

参数:

parameter.data 得到tensor数据

parameter.requires_grad 默认为True, BP过程中会求导

Parameter一般是在Modules中作为权重和偏置,自动加入参数列表,可以进行保存恢复。和Variable具有相同的运算。

我们可以这样简单区分,在计算图中,数据(包括输入数据和计算过程中产生的feature map等)时variable类型,该类型不会被保存到模型中。 网络的权重是parameter类型,在计算过程中会被更新,将会被保存到模型中。

以上这篇pytorch自定义初始化权重的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python Mysql自动备份脚本
Jul 14 Python
Python中列表的一些基本操作知识汇总
May 20 Python
Python在Windows和在Linux下调用动态链接库的教程
Aug 18 Python
用Python将IP地址在整型和字符串之间轻松转换
Mar 22 Python
python3大文件解压和基本操作
Dec 15 Python
TensorFlow 合并/连接数组的方法
Jul 27 Python
python3实现爬取淘宝美食代码分享
Sep 23 Python
Python3调用百度AI识别图片中的文字功能示例【测试可用】
Mar 13 Python
Python两台电脑实现TCP通信的方法示例
May 06 Python
使用python远程操作linux过程解析
Dec 04 Python
浅谈在django中使用filter()(即对QuerySet操作)时踩的坑
Mar 31 Python
利用 Python 的 Pandas和 NumPy 库来清理数据
Apr 13 Python
在Pytorch中使用样本权重(sample_weight)的正确方法
Aug 17 #Python
获取Pytorch中间某一层权重或者特征的例子
Aug 17 #Python
pyenv与virtualenv安装实现python多版本多项目管理
Aug 17 #Python
pytorch 获取层权重,对特定层注入hook, 提取中间层输出的方法
Aug 17 #Python
关于PyTorch源码解读之torchvision.models
Aug 17 #Python
django项目用higcharts统计最近七天文章点击量
Aug 17 #Python
Django对models里的objects的使用详解
Aug 17 #Python
You might like
Syphon 使用方法
2021/03/03 冲泡冲煮
PHP错误处理函数
2016/04/03 PHP
php生成Android客户端扫描可登录的二维码
2016/05/13 PHP
PHP策略模式定义与用法示例
2017/07/27 PHP
PHP+Ajax实现的博客文章添加类别功能示例
2018/03/29 PHP
tp5递归 无限级分类详解
2019/10/18 PHP
IE下JS读取xml文件示例代码
2013/08/05 Javascript
jQuery实现鼠标经过提示信息的地图热点效果
2015/04/26 Javascript
JavaScript实战之带收放动画效果的导航菜单
2016/08/16 Javascript
js前端解决跨域问题的8种方案(最新最全)
2016/11/18 Javascript
学习node.js 断言的使用详解
2019/03/18 Javascript
浅谈js闭包理解
2019/04/01 Javascript
Vue-cli assets SubDirectory及PublicPath区别详解
2020/08/18 Javascript
[01:35]2018年度CS GO最佳战队-完美盛典
2018/12/17 DOTA
python将ip地址转换成整数的方法
2015/03/17 Python
Python RuntimeError: thread.__init__() not called解决方法
2015/04/28 Python
深入解析Python中的lambda表达式的用法
2015/08/28 Python
python使用电子邮件模块smtplib的方法
2016/08/28 Python
python脚本替换指定行实现步骤
2017/07/11 Python
pycharm远程调试openstack的图文教程
2017/11/21 Python
详细解读tornado协程(coroutine)原理
2018/01/15 Python
python与caffe改变通道顺序的方法
2018/08/04 Python
pyqt5实现按钮添加背景图片以及背景图片的切换方法
2019/06/13 Python
python中使用while循环的实例
2019/08/05 Python
python获取Linux发行版名称
2019/08/30 Python
Python 开发工具PyCharm安装教程图文详解(新手必看)
2020/02/28 Python
EGO Shoes美国/加拿大:英国时髦鞋类品牌
2018/08/04 全球购物
Lululemon加拿大官网:加拿大知名体育服装零售商
2019/04/12 全球购物
美体小铺波兰官方网站:The Body Shop波兰
2019/09/03 全球购物
交通事故赔偿协议书范本
2014/04/15 职场文书
六一儿童节演讲稿
2014/05/23 职场文书
省级优秀班集体申报材料
2014/05/25 职场文书
我的中国梦演讲稿初中篇
2014/08/19 职场文书
环卫工作汇报材料
2014/10/28 职场文书
四年级学生期末评语
2014/12/26 职场文书
继续教育个人总结
2015/03/03 职场文书