编程 Python

使用Pytorch训练two-head网络的操作

Posted in Python onMay 28, 2021

以前的训练方法：

之前是把两个head分开进行训练的，因此每一轮训练先要对一个batch的数据进行划分，然后再分别训练两个头。代码如下：

f_out_y0, _ = net(x0)
            _, f_out_y1 = net(x1)
            #实例化损失函数
            criterion0 = Loss()
            criterion1 = Loss()
            loss0 = criterion0(f_y0, f_out_y0, w0)
            loss1 = criterion1(f_y1, f_out_y1, w1)
            print(loss0.item(), loss1.item())
            #对网络参数进行初始化
            optimizer.zero_grad()
            loss0.backward()
            loss1.backward()
            #对网络的参数进行更新
            optimizer.step()

但是在实际操作中想到那这样的话岂不是每次都先使用t=0的数据训练公共的表示层，再使用t=1的数据去训练。这样会不会使表示层产生bias呢？且这样两步训练也很麻烦。

修改后的方法

使用之前训练方法其实还是对神经网络的训练的机理不清楚。事实上，在计算loss的时候每个数据点的梯度都是单独计算的。

因此完全可以把网络前向传播得到结果按之前的顺序拼接起来后再进行梯度的反向传播，这样就可以只进行一步训练，且不会出现训练先后的偏差。

代码如下：

f_out_y0, cf_out_y0 = net(x0)
            cf_out_y1, f_out_y1 = net(x1)
            #按照t=0和t=1的索引拼接向量
            y_pred = torch.zeros([len(x), 1])
            y_pred[index0] = f_out_y0
            y_pred[index1] = f_out_y1
            
   criterion = Loss()
            loss = criterion(f_y, y_pred, w) + 0.01 * (l2_regularization0 + l2_regularization1)
            #print(loss.item())
            viz.line([float(loss)], [epoch], win='train_loss', update='append')
            optimizer.zero_grad()
            loss.backward()
            #对网络的参数进行更新
            optimizer.step()

总结

two-head网络前向传播得到结果的时候是分开得到的，训练的时候通过拼接预测结果可以实现一次训练。

补充：Pytorch训练网络的一般步骤

如下所示：

import torch 
print(torch.tensor([1,2,3],dtype=torch.float))#将一个列表强制转换为torch.Tensor类型
print(torch.randn(5,3))#生成torch.Tensor类型的5X3的随机数

1、构建模型

2、定义一个损失函数

3、定义一个优化器

4、将训练数据带入模型得到预测值

5、将梯度清零

6、获得损失

7、进行优化

import torch
from torch.autograd import Variable
 
#初步认识构建Tensor数据
def one():
    print(torch.tensor([1,2,3],dtype=torch.float))#将一个列表强制转换为torch.Tensor类型
    print(torch.randn(5,3))#生成torch.Tensor类型的5X3的随机数
    print(torch.zeros((2,3)))#生成一个2X3的全零矩阵
    print(torch.ones((2,3)))#生成一个2X3的全一矩阵
    a = torch.randn((2,3))
    b = a.numpy()#将一个torch.Tensor转换为numpy
    c = torch.from_numpy(b)#将numpy转换为Tensor
    print(a)
    print(b)
    print(c)
 
#使用Variable自动求导
def two():
    # 构建Variable
    x = Variable(torch.Tensor([1, 2, 3]), requires_grad=True)
    w = Variable(torch.Tensor([4, 5, 6]), requires_grad=True)
    b = Variable(torch.Tensor([7, 8, 9]), requires_grad=True)
    # 函数等式
    y = w * x ** 2 + b
    # 使用梯度下降计算各变量的偏导数
    y.backward(torch.Tensor([1, 1, 1]))
    print(x.grad)
    print(w.grad)
    print(b.grad)

线性回归例子：

import torch
from torch.autograd import Variable
import numpy as np
import matplotlib.pyplot as plt
from torch import nn
 
x = torch.unsqueeze(torch.linspace(-1,1,100),dim=1)
y = 3*x+10+torch.rand(x.size())
class LinearRegression(nn.Module):
    def __init__(self):
        super(LinearRegression,self).__init__()
        self.Linear = nn.Linear(1,1)
    def forward(self,x):
        return self.Linear(x)
model = LinearRegression()
Loss = nn.MSELoss()
Opt = torch.optim.SGD(model.parameters(),lr=0.01)
for i in range(1000):
    inputs = Variable(x)
    targets = Variable(y)
    outputs = model(inputs)
    loss = Loss(outputs,targets)
    Opt.zero_grad()
    loss.backward()
    Opt.step()
model.eval()
predict = model(Variable(x))
plt.plot(x.numpy(),y.numpy(),'ro')
plt.plot(x.numpy(),predict.data.numpy())
plt.show()

以上为个人经验，希望能给大家一个参考，也希望大家多多支持三水点靠木。

使用Pytorch训练two-head网络的操作

- Author -

XJTU-Qidong

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python开启多个子进程并行运行的方法

Apr 18 Python

python3实现抓取网页资源的 N 种方法

May 02 Python

详解Python中的分组函数groupby和itertools）

Jul 11 Python

用pycharm开发django项目示例代码

Oct 24 Python

python在openstreetmap地图上绘制路线图的实现

Jul 11 Python

基于Python+Appium实现京东双十一自动领金币功能

Oct 31 Python

pytorch 数据处理:定义自己的数据集合实例

Dec 31 Python

解决python DataFrame 打印结果不换行问题

Apr 09 Python

浅谈Python 函数式编程

Jun 20 Python

使用Pytorch搭建模型的步骤

Nov 16 Python

Python实现生成bmp图像的方法

Jun 13 Python

numpy array找出符合条件的数并赋值的示例代码

Jun 01 Python

使用Python的开发框架Brownie部署以太坊智能合约

使用Pytorch实现two-head(多输出)模型的操作

8g内存用python读取10文件_面试题-python 如何读取一个大于 10G 的txt文件？

用python画城市轮播地图

用Python实现一个打字速度测试工具来测试你的手速

解决Pytorch dataloader时报错每个tensor维度不一样的问题

May 28 #Python

pytorch锁死在dataloader(训练时卡死)

You might like

yii框架源码分析之创建controller代码

2011/06/28 PHP

php函数实现判断是否移动端访问

2015/03/03 PHP

php安装swoole扩展的方法

2015/03/19 PHP

javascript 关于# 和 void的区别分析

2009/10/26 Javascript

javascript游戏开发之《三国志曹操传》零部件开发(三)情景对话中仿打字机输出文字

2013/01/23 Javascript

JS返回上一页实例代码通过图片和按钮分别实现

2013/08/16 Javascript

js如何设置在iframe框架中指定div不显示

2013/12/04 Javascript

js判断设备是否为PC并调整图片大小

2014/02/12 Javascript

Windows系统下Node.js的简单入门教程

2015/06/23 Javascript

使用JavaScript和CSS实现文本隔行换色的方法

2015/11/04 Javascript

每天一篇javascript学习小结（Array数组）

2015/11/11 Javascript

jQuery图片轮播实现并封装(一)

2016/12/03 Javascript

Javascript之深入浅出prototype

2017/02/06 Javascript

JavaScript基于扩展String实现替换字符串中index处字符的方法

2017/06/13 Javascript

AngularJS中table表格基本操作示例

2017/10/10 Javascript

Vue实现简易翻页效果源码分享

2018/11/08 Javascript

JS/jQuery实现获取时间的方法及常用类完整示例

2019/03/07 jQuery

JavaScript ECMA-262-3 深入解析（二）：变量对象实例详解

2020/04/25 Javascript

Node.js API详解之 querystring用法实例分析

2020/04/29 Javascript

jquery更改元素属性attr()方法操作示例

2020/05/22 jQuery

vue 动态添加class,三个以上的条件做判断方式

2020/11/02 Javascript

Python 包含汉字的文件读写之每行末尾加上特定字符

2016/12/12 Python

python入门：这篇文章带你直接学会python

2018/09/14 Python

python将字符串转换成json的方法小结

2019/07/09 Python

PIL对上传到Django的图片进行处理并保存的实例

2019/08/07 Python

django中使用事务及接入支付宝支付功能

2019/09/15 Python

写给妈妈的道歉信

2014/01/11 职场文书

社区国庆节活动方案

2014/02/05 职场文书

公司廉洁自律承诺书

2014/03/27 职场文书

金榜题名主持词

2015/07/02 职场文书

赡养老人协议书范本

2015/08/06 职场文书

《称赞》教学反思

2016/02/17 职场文书

WordPress多语言翻译插件 - WPML使用教程

2021/04/01 PHP

一小时迅速入门Mybatis之bind与多数据源支持 Java API

2021/09/15 Javascript

java如何实现获取客户端ip地址的示例代码

2022/04/07 Java/Android

nginx容器方式反向代理实战

2022/04/18 Servers