编程 Python

Pytorch自己加载单通道图片用作数据集训练的实例

Posted in Python onJanuary 18, 2020

pytorch 在torchvision包里面有很多的的打包好的数据集，例如minist,Imagenet-12,CIFAR10 和CIFAR100。在torchvision的dataset包里面，用的时候直接调用就行了。具体的调用格式可以去看文档（目前好像只有英文的）。网上也有很多源代码。

不过，当我们想利用自己制作的数据集来训练网络模型时，就要有自己的方法了。pytorch在torchvision.dataset包里面封装过一个函数ImageFolder（）。这个函数功能很强大，只要你直接将数据集路径保存为例如“train/1/1.jpg ,rain/1/2.jpg …… ”就可以根据根目录“./train”将数据集装载了。

dataset.ImageFolder(root="datapath", transfroms.ToTensor())

但是后来我发现一个问题，就是这个函数加载出来的图像矩阵都是三通道的，并且没有什么参数调用可以让其变为单通道。如果我们要用到单通道数据集（灰度图）的话，比如自己加载Lenet-5模型的数据集，就只能自己写numpy数组再转为pytorch的Tensor()张量了。

接下来是我做的过程：

首先，还是要用到opencv,用灰度图打开一张图片，省事。

#读取图片　这里是灰度图　
 for item in all_path:
  img = cv2.imread(item[1],0)
  img = cv2.resize(img,(28,28))
  arr = np.asarray(img,dtype="float32")
  data_x[i ,:,:,:] = arr
  i+=1
  data_y.append(int(item[0]))
  
 data_x = data_x / 255
 data_y = np.asarray(data_y)

其次，pytorch有自己的numpy转Tensor函数，直接转就行了。

data_x = torch.from_numpy(data_x)
 data_y = torch.from_numpy(data_y)

下一步利用torch.util和torchvision里面的dataLoader函数，就能直接得到和torchvision.dataset里面封装好的包相同的数据集样本了

dataset = dataf.TensorDataset(data_x,data_y)
 loader = dataf.DataLoader(dataset, batch_size=batchsize, shuffle=True)

最后就是自己建网络设计参数训练了，这部分和文档以及github中的差不多，就不赘述了。

下面是整个程序的源代码，我利用的还是上次的车标识别的数据集，一共分四类，用的是2层卷积核两层全连接。

源代码：

# coding=utf-8
import os
import cv2
import numpy as np
import random
 
import torch
import torch.nn as nn
import torch.utils.data as dataf
from torch.autograd import Variable
import torch.nn.functional as F
import torch.optim as optim
 
#训练参数
cuda = False
train_epoch = 20
train_lr = 0.01
train_momentum = 0.5
batchsize = 5
 
 
#测试训练集路径
test_path = "/home/test/"
train_path = "/home/train/"
 
#路径数据
all_path =[]
 
def load_data(data_path):
 signal = os.listdir(data_path)
 for fsingal in signal: 
  filepath = data_path+fsingal
  filename = os.listdir(filepath)
  for fname in filename:
   ffpath = filepath+"/"+fname
   path = [fsingal,ffpath]
   all_path.append(path)
   
#设立数据集多大
 count = len(all_path)
 data_x = np.empty((count,1,28,28),dtype="float32")
 data_y = []
#打乱顺序
 random.shuffle(all_path)
 i=0;
 
#读取图片　这里是灰度图　最后结果是i*i*i*i
#分别表示：batch大小　，　通道数，　像素矩阵
 for item in all_path:
  img = cv2.imread(item[1],0)
  img = cv2.resize(img,(28,28))
  arr = np.asarray(img,dtype="float32")
  data_x[i ,:,:,:] = arr
  i+=1
  data_y.append(int(item[0]))
  
 data_x = data_x / 255
 data_y = np.asarray(data_y)
#  lener = len(all_path)
 data_x = torch.from_numpy(data_x)
 data_y = torch.from_numpy(data_y)
 dataset = dataf.TensorDataset(data_x,data_y)
 
 loader = dataf.DataLoader(dataset, batch_size=batchsize, shuffle=True)
  
 return loader
#  print data_y
 
 
 
train_load = load_data(train_path)
test_load = load_data(test_path)
 
class L5_NET(nn.Module):
 def __init__(self):
  super(L5_NET ,self).__init__();
  #第一层输入1，20个卷积核　每个5*5
  self.conv1 = nn.Conv2d(1 , 20 , kernel_size=5)
  #第二层输入20，30个卷积核　每个5*5
  self.conv2 = nn.Conv2d(20 , 30 , kernel_size=5)
  #drop函数
  self.conv2_drop = nn.Dropout2d()
  #全链接层１，展开30*4*4，连接层50个神经元
  self.fc1 = nn.Linear(30*4*4,50)
  #全链接层１，50-4 ,4为最后的输出分类
  self.fc2 = nn.Linear(50,4)
 
 #前向传播
 def forward(self,x):
  #池化层１ 对于第一层卷积池化，池化核2*2
  x = F.relu(F.max_pool2d( self.conv1(x)  ,2 ) )
  #池化层2 对于第二层卷积池化，池化核2*2
  x = F.relu(F.max_pool2d( self.conv2_drop( self.conv2(x) ) , 2 ) )
  #平铺轴30*4*4个神经元
  x = x.view(-1 , 30*4*4)
  #全链接１
  x = F.relu( self.fc1(x) )
  #dropout链接
  x = F.dropout(x , training= self.training)
  #全链接w
  x = self.fc2(x)
  #softmax链接返回结果
  return F.log_softmax(x)
 
model = L5_NET()
if cuda :
 model.cuda()
  
 
optimizer = optim.SGD(model.parameters()  , lr =train_lr , momentum = train_momentum )
 
#预测函数
def train(epoch):
 model.train()
 for batch_idx, (data, target) in enumerate(train_load):
  if cuda:
   data, target = data.cuda(), target.cuda()
  data, target = Variable(data), Variable(target)
  #求导
  optimizer.zero_grad()
  #训练模型，输出结果
  output = model(data)
  #在数据集上预测loss
  loss = F.nll_loss(output, target)
  #反向传播调整参数pytorch直接可以用loss
  loss.backward()
  #SGD刷新进步
  optimizer.step()
  #实时输出
  if batch_idx % 10 == 0:
   print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
    epoch, batch_idx * len(data), len(train_load.dataset),
    100. * batch_idx / len(train_load), loss.data[0]))
#    
   
#测试函数
def test(epoch):
 model.eval()
 test_loss = 0
 correct = 0
 for data, target in test_load:
  
  if cuda:
   data, target = data.cuda(), target.cuda()
   
  data, target = Variable(data, volatile=True), Variable(target)
  #在测试集上预测
  output = model(data)
  #计算在测试集上的loss
  test_loss += F.nll_loss(output, target).data[0]
  #获得预测的结果
  pred = output.data.max(1)[1] # get the index of the max log-probability
  #如果正确，correct+1
  correct += pred.eq(target.data).cpu().sum()
 
 #loss计算
 test_loss = test_loss
 test_loss /= len(test_load)
 #输出结果
 print('\nThe {} epoch result : Average loss: {:.6f}, Accuracy: {}/{} ({:.2f}%)\n'.format(
  epoch,test_loss, correct, len(test_load.dataset),
  100. * correct / len(test_load.dataset)))
 
for epoch in range(1, train_epoch+ 1):
 train(epoch)
 test(epoch)

最后的训练结果和在keras下差不多，不过我训练的时候好像把训练集和测试集弄反了，数目好像测试集比训练集还多，有点尴尬，不过无伤大雅。结果图如下：

Pytorch自己加载单通道图片用作数据集训练的实例

以上这篇Pytorch自己加载单通道图片用作数据集训练的实例就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

Pytorch自己加载单通道图片用作数据集训练的实例

- Author -

灰色橡皮擦

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python 提取文件的小程序

Jul 29 Python

python爬取网站数据保存使用的方法

Nov 20 Python

VTK与Python实现机械臂三维模型可视化详解

Dec 13 Python

pandas DataFrame实现几列数据合并成为新的一列方法

Jun 08 Python

Python用Try语句捕获异常的实例方法

Jun 26 Python

python 数据生成excel导出（xlwt,wlsxwrite）代码实例

Aug 23 Python

Django实现分页显示效果

Oct 31 Python

python numpy 矩阵堆叠实例

Jan 17 Python

Pytorch中的自动求梯度机制和Variable类实例

Feb 29 Python

Python自定义聚合函数merge与transform区别详解

May 26 Python

15款Python编辑器的优缺点,别再问我“选什么编辑器”啦

Oct 19 Python

python3中TQDM库安装及使用详解

Nov 18 Python

pyinstaller 3.6版本通过pip安装失败的解决办法(推荐)

Jan 18 #Python

Python实现点云投影到平面显示

Jan 18 #Python

Pytorch 实现计算分类器准确率(总分类及子分类)

Jan 18 #Python

在pytorch 中计算精度、回归率、F1 score等指标的实例

Jan 18 #Python

Python中实现输入超时及如何通过变量获取变量名

Jan 18 #Python

Pytorch 计算误判率,计算准确率,计算召回率的例子

Jan 18 #Python

python:目标检测模型预测准确度计算方式(基于IoU)

Jan 18 #Python

You might like

php中使用临时表查询数据的一个例子

2013/02/03 PHP

JavaScript 替换Html标签实现代码

2009/10/14 Javascript

jQuery 瀑布流浮动布局（一）(延迟AJAX加载图片)

2012/05/23 Javascript

基于JavaScript操作DOM常用的API小结

2015/12/01 Javascript

JS Array创建及concat()split()slice()的使用方法

2016/06/03 Javascript

详解angularJS+Ionic移动端图片上传的解决办法

2017/09/13 Javascript

Nginx 配置多站点vhost 的方法

2018/01/07 Javascript

Vue的事件响应式进度条组件实例详解

2018/02/04 Javascript

详解Node.js中的Async和Await函数

2018/02/22 Javascript

bootstrap下拉分页样式带跳转页码

2018/12/29 Javascript

浅谈Vue2.4.0 $attrs与inheritAttrs的具体使用

2020/03/08 Javascript

详解Vue中的watch和computed

2020/11/09 Javascript

jQuery实现增删改查

2020/12/22 jQuery

[02:20]DOTA2英雄基础教程黑暗贤者

2013/12/19 DOTA

python处理cookie详解

2014/02/07 Python

浅析Python编写函数装饰器

2016/03/18 Python

python daemon守护进程实现

2016/08/27 Python

python读写json文件的简单实现

2017/04/11 Python

Python随机生成均匀分布在三角形内或者任意多边形内的点

2017/12/14 Python

python中将正则过滤的内容输出写入到文件中的实例

2018/10/21 Python

Python第三方库h5py_读取mat文件并显示值的方法

2019/02/08 Python

对Pycharm创建py文件时自定义头部模板的方法详解

2019/02/12 Python

Python两台电脑实现TCP通信的方法示例

2019/05/06 Python

使用TensorFlow实现简单线性回归模型

2019/07/19 Python

python 有效的括号的实现代码示例

2019/11/11 Python

如何使用selenium和requests组合实现登录页面

2020/02/03 Python

Python轻量级web框架bottle使用方法解析

2020/06/13 Python

记录一下scrapy中settings的一些配置小结

2020/09/28 Python

常用的四种CSS透明属性介绍

2014/04/12 HTML / CSS

教师自我评价范文

2013/12/16 职场文书

大学四年职业生涯规划书范文

2014/01/02 职场文书

给导游的表扬信

2014/01/10 职场文书

历史专业大学生职业生涯规划书

2014/03/13 职场文书

小学生环保标语

2014/06/13 职场文书

评奖评优个人先进事迹材料

2015/11/04 职场文书

2016年教师政治思想表现评语

2015/12/02 职场文书