编程 Python

深入理解Pytorch微调torchvision模型

Posted in Python onNovember 11, 2021

一、简介

在本小节，深入探讨如何对torchvision进行微调和特征提取。所有模型都已经预先在1000类的magenet数据集上训练完成。本节将深入介绍如何使用几个现代的CNN架构，并将直观展示如何微调任意的PyTorch模型。
本节将执行两种类型的迁移学习：

微调：从预训练模型开始，更新我们新任务的所有模型参数，实质上是重新训练整个模型。
特征提取：从预训练模型开始，仅更新从中导出预测的最终图层权重。它被称为特征提取，因为我们使用预训练的CNN作为固定的特征提取器，并且仅改变输出层。

通常这两种迁移学习方法都会遵循一下步骤：

初始化预训练模型
重组最后一层，使其具有与新数据集类别数相同的输出数
为优化算法定义想要的训练期间更新的参数
运行训练步骤

二、导入相关包

from __future__ import print_function
from __future__ import division
import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
import torchvision 
from torchvision import datasets,models,transforms
import matplotlib.pyplot as plt
import time
import os
import copy
print("Pytorch version:",torch.__version__)
print("torchvision version:",torchvision.__version__)

运行结果

深入理解Pytorch微调torchvision模型

三、数据输入

数据集——>我在这里

链接：https://pan.baidu.com/s/1G3yRfKTQf9sIq1iCSoymWQ
提取码：1234

#%%输入
data_dir="D:\Python\Pytorch\data\hymenoptera_data"
# 从[resnet,alexnet,vgg,squeezenet,desenet,inception]
model_name='squeezenet'
# 数据集中类别数量
num_classes=2
# 训练的批量大小
batch_size=8
# 训练epoch数
num_epochs=15
# 用于特征提取的标志。为FALSE，微调整个模型，为TRUE只更新图层参数
feature_extract=True

四、辅助函数

1、模型训练和验证

train_model函数处理给定模型的训练和验证。作为输入，它需要PyTorch模型、数据加载器字典、损失函数、优化器、用于训练和验证epoch数，以及当模型是初始模型时的布尔标志。
is_inception标志用于容纳 Inception v3 模型，因为该体系结构使用辅助输出，并且整体模型损失涉及辅助输出和最终输出，如此处所述。这个函数训练指定数量的epoch,并且在每个epoch之后运行完整的验证步骤。它还跟踪最佳性能的模型（从验证准确率方面），并在训练结束时返回性能最好的模型。在每个epoch之后，打印训练和验证正确率。

#%%模型训练和验证
device=torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
def train_model(model,dataloaders,criterion,optimizer,num_epochs=25,is_inception=False):
    since=time.time()
    val_acc_history=[]
    best_model_wts=copy.deepcopy(model.state_dict())
    best_acc=0.0
    for epoch in range(num_epochs):
        print('Epoch{}/{}'.format(epoch, num_epochs-1))
        print('-'*10)
        # 每个epoch都有一个训练和验证阶段
        for phase in['train','val']:
            if phase=='train':
                model.train()
            else:
                model.eval()
                
            running_loss=0.0
            running_corrects=0
            # 迭代数据
            for inputs,labels in dataloaders[phase]:
                inputs=inputs.to(device)
                labels=labels.to(device)
                # 梯度置零
                optimizer.zero_grad()
                # 向前传播
                with torch.set_grad_enabled(phase=='train'):
                    # 获取模型输出并计算损失，开始的特殊情况在训练中他有一个辅助输出
                    # 在训练模式下，通过将最终输出和辅助输出相加来计算损耗，在测试中值考虑最终输出
                    if is_inception and phase=='train':
                        outputs,aux_outputs=model(inputs)
                        loss1=criterion(outputs,labels)
                        loss2=criterion(aux_outputs,labels)
                        loss=loss1+0.4*loss2
                    else:
                        outputs=model(inputs)
                        loss=criterion(outputs,labels)
                        
                    _,preds=torch.max(outputs,1)
                    
                    if phase=='train':
                        loss.backward()
                        optimizer.step()
                        
                # 添加
                running_loss+=loss.item()*inputs.size(0)
                running_corrects+=torch.sum(preds==labels.data)
                
            epoch_loss=running_loss/len(dataloaders[phase].dataset)
            epoch_acc=running_corrects.double()/len(dataloaders[phase].dataset)
            
            print('{}loss : {:.4f} acc:{:.4f}'.format(phase, epoch_loss,epoch_acc))
            
            if phase=='train' and epoch_acc>best_acc:
                best_acc=epoch_acc
                best_model_wts=copy.deepcopy(model.state_dict())
            if phase=='val':
                val_acc_history.append(epoch_acc)
            
        print()

    time_elapsed=time.time()-since
    print('training complete in {:.0f}s'.format(time_elapsed//60, time_elapsed%60))
    print('best val acc:{:.4f}'.format(best_acc))
    
    model.load_state_dict(best_model_wts)
    return model,val_acc_history

2、设置模型参数的'.requires_grad属性'

当我们进行特征提取时，此辅助函数将模型中参数的 .requires_grad 属性设置为False。
默认情况下，当我们加载一个预训练模型时，所有参数都是 .requires_grad = True，如果我们从头开始训练或微调，这种设置就没问题。
但是，如果我们要运行特征提取并且只想为新初始化的层计算梯度，那么我们希望所有其他参数不需要梯度变化。

#%%设置模型参数的.require——grad属性
def set_parameter_requires_grad(model,feature_extracting):
    if feature_extracting:
        for param in model.parameters():
            param.require_grad=False

靓仔今天先去跑步了，再不跑来不及了，先更这么多，后续明天继续~（感谢有人没有催更！感谢监督！希望继续监督！）

以上就是深入理解Pytorch微调torchvision模型的详细内容，更多关于Pytorch torchvision模型的资料请关注三水点靠木其它相关文章！

深入理解Pytorch微调torchvision模型

- Author -

柚子味的羊

- Original Sources -

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python实现list元素按关键字相加减的方法示例

Jun 09 Python

python实现发送邮件功能

Jul 22 Python

Python标准库之itertools库的使用方法

Sep 07 Python

基于使用paramiko执行远程linux主机命令(详解)

Oct 16 Python

python如何求解两数的最大公约数

Sep 27 Python

[原创]Python入门教程1. 基本运算【四则运算、变量、math模块等】

Oct 28 Python

python 检查数据中是否有缺失值,删除缺失值的方式

Dec 02 Python

Python3.6 + TensorFlow 安装配置图文教程（Windows 64 bit）

Feb 24 Python

python tkinter之复选、文本、下拉的实现

Mar 04 Python

Python numpy大矩阵运算内存不足如何解决

Nov 19 Python

python爬虫如何解决图片验证码

Feb 14 Python

Django Paginator分页器的使用示例

Jun 23 Python

Python 中 Shutil 模块详情

Nov 11 #Python

django 认证类配置实现

Nov 11 #Python

Python Pandas数据分析之iloc和loc的用法详解

据Python爬虫不靠谱预测可知今年双十一销售额将超过6000亿元

Python 详解通过Scrapy框架实现爬取百度新冠疫情数据流程

python中tkinter复选框使用操作

Nov 11 #Python

Python中的变量与常量

Nov 11 #Python

You might like

玩家交还《星际争霸》原始码光盘暴雪报以厚礼

2017/05/05 星际争霸

使用php实现快钱支付功能(涉及到接口)

2013/07/01 PHP

php实现递归与无限分类的方法

2015/02/16 PHP

php获取POST数据的三种方法实例详解

2016/12/20 PHP

javascript 鼠标滚轮事件

2009/04/09 Javascript

解析javascript 数组以及json元素的添加删除

2013/06/26 Javascript

探讨js中的双感叹号判断

2013/11/11 Javascript

自己封装的javascript事件队列函数版

2014/06/12 Javascript

如何用jQuery实现ASP.NET GridView折叠伸展效果

2015/09/26 Javascript

详解JavaScript对Date对象的操作问题(生成一个倒数7天的数组)

2015/10/01 Javascript

深入浅析AngularJS和DataModel

2016/02/16 Javascript

JS获取input file绝对路径的方法(推荐)

2016/08/02 Javascript

bootstrap+jQuery实现的动态进度条功能示例

2017/05/25 jQuery

angular2中Http请求原理与用法详解

2018/01/11 Javascript

浅谈mvvm-simple双向绑定简单实现

2018/04/18 Javascript

JSON是什么？有哪些优点？JSON和XML的区别？

2019/04/29 Javascript

在Python中利用Pandas库处理大数据的简单介绍

2015/04/07 Python

Python字符串格式化输出方法分析

2016/04/13 Python

Python 3中print函数的使用方法总结

2017/08/08 Python

python 计算一个字符串中所有数字的和实例

2019/06/11 Python

在自动化中用python实现键盘操作的方法详解

2019/07/19 Python

pytorch 自定义卷积核进行卷积操作方式

2019/12/30 Python

部署Django到阿里云服务器教程示例

2020/06/03 Python

如何在Python对Excel进行读取

2020/06/04 Python

Python为何不支持switch语句原理详解

2020/10/21 Python

5分钟实现Canvas鼠标跟随动画背景

2019/11/18 HTML / CSS

英国派对礼服和连衣裙购物网站：TFNC London

2018/07/07 全球购物

Belstaff英国官方在线商店：Belstaff.co.uk

2021/02/09 全球购物

Delphi笔试题

2016/11/14 面试题

反四风对照检查材料思想汇报

2014/09/16 职场文书

区政府领导班子个人对照检查材料

2014/09/25 职场文书

中职毕业生自我鉴定范文（3篇）

2014/09/28 职场文书

2015年中学元旦晚会活动方案

2014/12/09 职场文书

故宫英文导游词

2015/01/31 职场文书

使用python生成大量数据写入es数据库并查询操作(2)

2022/09/23 Python

深入理解Pytorch微调torchvision模型

目录

一、简介

二、导入相关包

三、数据输入

四、辅助函数

1、模型训练和验证

2、设置模型参数的'.requires_grad属性'