Pytorch中Tensor与各种图像格式的相互转化详解


Posted in Python onDecember 26, 2019

前言

在pytorch中经常会遇到图像格式的转化,例如将PIL库读取出来的图片转化为Tensor,亦或者将Tensor转化为numpy格式的图片。而且使用不同图像处理库读取出来的图片格式也不相同,因此,如何在pytorch中正确转化各种图片格式(PIL、numpy、Tensor)是一个在调试中比较重要的问题。

本文主要说明在pytorch中如何正确将图片格式在各种图像库读取格式以及tensor向量之间转化的问题。以下代码经过测试都可以在Pytorch-0.4.0或0.3.0版本直接使用。

对python不同的图像库读取格式有疑问可以看这里:https://3water.com/article/177288.htm

格式转换

我们一般在pytorch或者python中处理的图像无非这几种格式:

  • PIL:使用python自带图像处理库读取出来的图片格式
  • numpy:使用python-opencv库读取出来的图片格式
  • tensor:pytorch中训练时所采取的向量格式(当然也可以说图片)

注意,之后的讲解图片格式皆为RGB三通道,24-bit真彩色,也就是我们平常使用的图片形式。

PIL与Tensor

PIL与Tensor的转换相对容易些,因为pytorch已经提供了相关的代码,我们只需要搭配使用即可:

所有代码都已经引用了(之后的代码省略引用部分):

import torch
from PIL import Image
import matplotlib.pyplot as plt

# loader使用torchvision中自带的transforms函数
loader = transforms.Compose([
  transforms.ToTensor()]) 

unloader = transforms.ToPILImage()

1 PIL读取图片转化为Tensor

# 输入图片地址
# 返回tensor变量
def image_loader(image_name):
  image = Image.open(image_name).convert('RGB')
  image = loader(image).unsqueeze(0)
  return image.to(device, torch.float)

2 将PIL图片转化为Tensor

# 输入PIL格式图片
# 返回tensor变量
def PIL_to_tensor(image):
  image = loader(image).unsqueeze(0)
  return image.to(device, torch.float)

3 Tensor转化为PIL图片

# 输入tensor变量
# 输出PIL格式图片
def tensor_to_PIL(tensor):
  image = tensor.cpu().clone()
  image = image.squeeze(0)
  image = unloader(image)
  return image

4 直接展示tensor格式图片

def imshow(tensor, title=None):
  image = tensor.cpu().clone() # we clone the tensor to not do changes on it
  image = image.squeeze(0) # remove the fake batch dimension
  image = unloader(image)
  plt.imshow(image)
  if title is not None:
    plt.title(title)
  plt.pause(0.001) # pause a bit so that plots are updated

5 直接保存tensor格式图片

def save_image(tensor, **para):
  dir = 'results'
  image = tensor.cpu().clone() # we clone the tensor to not do changes on it
  image = image.squeeze(0) # remove the fake batch dimension
  image = unloader(image)
  if not osp.exists(dir):
    os.makedirs(dir)
  image.save('results_{}/s{}-c{}-l{}-e{}-sl{:4f}-cl{:4f}.jpg'
        .format(num, para['style_weight'], para['content_weight'], para['lr'], para['epoch'],
            para['style_loss'], para['content_loss']))

numpy与Tensor

numpy格式是使用cv2,也就是python-opencv库读取出来的图片格式,需要注意的是用python-opencv读取出来的图片和使用PIL读取出来的图片数据略微不同,经测试用python-opencv读取出来的图片在训练时的效果比使用PIL读取出来的略差一些(详细过程之后发布)。

之后所有代码引用:

import cv2
import torch
import matplotlib.pyplot as plt

numpy转化为tensor

def toTensor(img):
  assert type(img) == np.ndarray,'the img type is {}, but ndarry expected'.format(type(img))
  img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  img = torch.from_numpy(img.transpose((2, 0, 1)))
  return img.float().div(255).unsqueeze(0) # 255也可以改为256

tensor转化为numpy

def tensor_to_np(tensor):
  img = tensor.mul(255).byte()
  img = img.cpu().numpy().squeeze(0).transpose((1, 2, 0))
  return img

展示numpy格式图片

def show_from_cv(img, title=None):
  img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  plt.figure()
  plt.imshow(img)
  if title is not None:
    plt.title(title)
  plt.pause(0.001)

展示tensor格式图片

def show_from_tensor(tensor, title=None):
  img = tensor.clone()
  img = tensor_to_np(img)
  plt.figure()
  plt.imshow(img)
  if title is not None:
    plt.title(title)
  plt.pause(0.001)

注意

上面介绍的都是一张图片的转化,如果是n张图片一起的话,只需要修改一下相应代码即可。

举个例子,将之前说过的修改略微修改一下即可:

# 将 N x H x W X C 的numpy格式图片转化为相应的tensor格式
def toTensor(img):
  img = torch.from_numpy(img.transpose((0, 3, 1, 2)))
  return img.float().div(255).unsqueeze(0)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python不带重复的全排列代码
Aug 13 Python
简单介绍Python中利用生成器实现的并发编程
May 04 Python
Python读取指定目录下指定后缀文件并保存为docx
Apr 23 Python
Python基于分水岭算法解决走迷宫游戏示例
Sep 26 Python
Python安装lz4-0.10.1遇到的坑
May 20 Python
WIn10+Anaconda环境下安装PyTorch(避坑指南)
Jan 30 Python
Python3 实现文件批量重命名示例代码
Jun 03 Python
python安装requests库的实例代码
Jun 25 Python
如何使用Python多线程测试并发漏洞
Dec 18 Python
keras输出预测值和真实值方式
Jun 27 Python
pytorch 实现在测试的时候启用dropout
May 27 Python
Pygame游戏开发之太空射击实战敌人精灵篇
Aug 05 Python
基于h5py的使用及数据封装代码
Dec 26 #Python
python深copy和浅copy区别对比解析
Dec 26 #Python
详解python opencv、scikit-image和PIL图像处理库比较
Dec 26 #Python
torch 中各种图像格式转换的实现方法
Dec 26 #Python
python两个_多个字典合并相加的实例代码
Dec 26 #Python
Python时间差中seconds和total_seconds的区别详解
Dec 26 #Python
python requests模拟登陆github的实现方法
Dec 26 #Python
You might like
php的一些小问题
2010/07/03 PHP
从php核心代码分析require和include的区别
2011/01/02 PHP
Drupal读取Excel并导入数据库实例
2014/03/02 PHP
PHP判断文章里是否有图片的简单方法
2014/07/26 PHP
PHP防止刷新重复提交页面的示例代码
2015/11/11 PHP
js使用正则实现ReplaceAll全部替换的方法
2014/07/18 Javascript
jQuery中:only-child选择器用法实例
2015/01/03 Javascript
JavaScript中用sort()方法对数组元素进行排序的操作
2015/06/09 Javascript
js使用cookie记录用户名的方法
2015/11/26 Javascript
详解AngularJS中自定义过滤器
2015/12/28 Javascript
利用JS实现点击按钮后图片自动切换的简单方法
2016/10/24 Javascript
BootStrap select2 动态改变值的方法
2017/02/10 Javascript
js数字计算 误差问题的快速解决方法
2017/02/28 Javascript
vue watch普通监听和深度监听实例详解(数组和对象)
2018/08/16 Javascript
微信小程序template模板与component组件的区别和使用详解
2019/05/22 Javascript
vue 避免变量赋值后双向绑定的操作
2020/11/07 Javascript
python操作ssh实现服务器日志下载的方法
2015/06/03 Python
简单理解Python中的装饰器
2015/07/31 Python
python实现批量监控网站
2016/09/09 Python
让Python更加充分的使用Sqlite3
2017/12/11 Python
Python将图片转换为字符画的方法
2020/06/16 Python
Python基于matplotlib画箱体图检验异常值操作示例【附xls数据文件下载】
2019/01/07 Python
python opencv捕获摄像头并显示内容的实现
2019/07/11 Python
Python3显示当前时间、计算时间差及时间加减法示例代码
2019/09/07 Python
Python ckeditor富文本编辑器代码实例解析
2020/06/22 Python
解决python的空格和tab混淆而报错的问题
2021/02/26 Python
CSS3色彩模式有哪些?CSS3 HSL色彩模式的定义
2016/04/26 HTML / CSS
印尼旅游网站:via
2017/11/12 全球购物
阿里巴巴的Oracle DBA笔试题答案-SQL tuning类
2016/04/03 面试题
教育专业个人求职信
2013/12/02 职场文书
简短大学毕业感言
2014/01/18 职场文书
医务工作者先进事迹材料
2014/01/26 职场文书
教师作风建设剖析材料
2014/10/11 职场文书
债务纠纷委托书范本
2014/10/14 职场文书
放假通知格式
2015/04/14 职场文书
五年级作文之成长
2019/09/16 职场文书