Pytorch中Tensor与各种图像格式的相互转化详解


Posted in Python onDecember 26, 2019

前言

在pytorch中经常会遇到图像格式的转化,例如将PIL库读取出来的图片转化为Tensor,亦或者将Tensor转化为numpy格式的图片。而且使用不同图像处理库读取出来的图片格式也不相同,因此,如何在pytorch中正确转化各种图片格式(PIL、numpy、Tensor)是一个在调试中比较重要的问题。

本文主要说明在pytorch中如何正确将图片格式在各种图像库读取格式以及tensor向量之间转化的问题。以下代码经过测试都可以在Pytorch-0.4.0或0.3.0版本直接使用。

对python不同的图像库读取格式有疑问可以看这里:https://3water.com/article/177288.htm

格式转换

我们一般在pytorch或者python中处理的图像无非这几种格式:

  • PIL:使用python自带图像处理库读取出来的图片格式
  • numpy:使用python-opencv库读取出来的图片格式
  • tensor:pytorch中训练时所采取的向量格式(当然也可以说图片)

注意,之后的讲解图片格式皆为RGB三通道,24-bit真彩色,也就是我们平常使用的图片形式。

PIL与Tensor

PIL与Tensor的转换相对容易些,因为pytorch已经提供了相关的代码,我们只需要搭配使用即可:

所有代码都已经引用了(之后的代码省略引用部分):

import torch
from PIL import Image
import matplotlib.pyplot as plt

# loader使用torchvision中自带的transforms函数
loader = transforms.Compose([
  transforms.ToTensor()]) 

unloader = transforms.ToPILImage()

1 PIL读取图片转化为Tensor

# 输入图片地址
# 返回tensor变量
def image_loader(image_name):
  image = Image.open(image_name).convert('RGB')
  image = loader(image).unsqueeze(0)
  return image.to(device, torch.float)

2 将PIL图片转化为Tensor

# 输入PIL格式图片
# 返回tensor变量
def PIL_to_tensor(image):
  image = loader(image).unsqueeze(0)
  return image.to(device, torch.float)

3 Tensor转化为PIL图片

# 输入tensor变量
# 输出PIL格式图片
def tensor_to_PIL(tensor):
  image = tensor.cpu().clone()
  image = image.squeeze(0)
  image = unloader(image)
  return image

4 直接展示tensor格式图片

def imshow(tensor, title=None):
  image = tensor.cpu().clone() # we clone the tensor to not do changes on it
  image = image.squeeze(0) # remove the fake batch dimension
  image = unloader(image)
  plt.imshow(image)
  if title is not None:
    plt.title(title)
  plt.pause(0.001) # pause a bit so that plots are updated

5 直接保存tensor格式图片

def save_image(tensor, **para):
  dir = 'results'
  image = tensor.cpu().clone() # we clone the tensor to not do changes on it
  image = image.squeeze(0) # remove the fake batch dimension
  image = unloader(image)
  if not osp.exists(dir):
    os.makedirs(dir)
  image.save('results_{}/s{}-c{}-l{}-e{}-sl{:4f}-cl{:4f}.jpg'
        .format(num, para['style_weight'], para['content_weight'], para['lr'], para['epoch'],
            para['style_loss'], para['content_loss']))

numpy与Tensor

numpy格式是使用cv2,也就是python-opencv库读取出来的图片格式,需要注意的是用python-opencv读取出来的图片和使用PIL读取出来的图片数据略微不同,经测试用python-opencv读取出来的图片在训练时的效果比使用PIL读取出来的略差一些(详细过程之后发布)。

之后所有代码引用:

import cv2
import torch
import matplotlib.pyplot as plt

numpy转化为tensor

def toTensor(img):
  assert type(img) == np.ndarray,'the img type is {}, but ndarry expected'.format(type(img))
  img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  img = torch.from_numpy(img.transpose((2, 0, 1)))
  return img.float().div(255).unsqueeze(0) # 255也可以改为256

tensor转化为numpy

def tensor_to_np(tensor):
  img = tensor.mul(255).byte()
  img = img.cpu().numpy().squeeze(0).transpose((1, 2, 0))
  return img

展示numpy格式图片

def show_from_cv(img, title=None):
  img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  plt.figure()
  plt.imshow(img)
  if title is not None:
    plt.title(title)
  plt.pause(0.001)

展示tensor格式图片

def show_from_tensor(tensor, title=None):
  img = tensor.clone()
  img = tensor_to_np(img)
  plt.figure()
  plt.imshow(img)
  if title is not None:
    plt.title(title)
  plt.pause(0.001)

注意

上面介绍的都是一张图片的转化,如果是n张图片一起的话,只需要修改一下相应代码即可。

举个例子,将之前说过的修改略微修改一下即可:

# 将 N x H x W X C 的numpy格式图片转化为相应的tensor格式
def toTensor(img):
  img = torch.from_numpy(img.transpose((0, 3, 1, 2)))
  return img.float().div(255).unsqueeze(0)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
从零学python系列之从文件读取和保存数据
May 23 Python
深度剖析使用python抓取网页正文的源码
Jun 11 Python
Python和perl实现批量对目录下电子书文件重命名的代码分享
Nov 21 Python
python插入排序算法实例分析
Jul 03 Python
Python的MongoDB模块PyMongo操作方法集锦
Jan 05 Python
Scrapy抓取京东商品、豆瓣电影及代码分享
Nov 23 Python
python3实现基于用户的协同过滤
May 31 Python
Django跨域请求问题的解决方法示例
Jun 16 Python
Pandas删除数据的几种情况(小结)
Jun 21 Python
Python中flatten( ),matrix.A用法说明
Jul 05 Python
Python字符串查找基本操作代码案例
Oct 27 Python
利用Python多线程实现图片下载器
Mar 25 Python
基于h5py的使用及数据封装代码
Dec 26 #Python
python深copy和浅copy区别对比解析
Dec 26 #Python
详解python opencv、scikit-image和PIL图像处理库比较
Dec 26 #Python
torch 中各种图像格式转换的实现方法
Dec 26 #Python
python两个_多个字典合并相加的实例代码
Dec 26 #Python
Python时间差中seconds和total_seconds的区别详解
Dec 26 #Python
python requests模拟登陆github的实现方法
Dec 26 #Python
You might like
PHP实现提取一个图像文件并在浏览器上显示的代码
2012/10/06 PHP
解决php接收shell返回的结果中文乱码问题
2014/01/23 PHP
浅谈javascript中this在事件中的应用
2015/02/15 Javascript
如何提高数据访问速度
2016/12/26 Javascript
从零开始学习Node.js系列教程四:多页面实现的数学运算示例
2017/04/13 Javascript
vue子父组件通信的实现代码
2017/07/09 Javascript
解决React Native端口号修改的方法
2017/07/28 Javascript
Angular使用 ng-img-max 调整浏览器中的图片的示例代码
2017/08/17 Javascript
利用JS测试目标网站的打开响应速度
2017/12/01 Javascript
Vue2实时监听表单变化的示例讲解
2018/08/30 Javascript
jQuery pagination分页示例详解
2018/10/23 jQuery
微信小程序实现的canvas合成图片功能示例
2019/05/03 Javascript
Vue CLI3中使用compass normalize的方法
2019/05/30 Javascript
弱类型语言javascript中 a,b 的运算实例小结
2019/08/07 Javascript
Python使用htpasswd实现基本认证授权的例子
2014/06/10 Python
Python代码调试的几种方法总结
2015/04/15 Python
在Python中操作文件之seek()方法的使用教程
2015/05/24 Python
利用Opencv中Houghline方法实现直线检测
2018/02/11 Python
Django中使用Celery的教程详解
2018/08/24 Python
用Python实现筛选文件脚本的方法
2018/10/27 Python
Python实现FTP文件传输的实例
2019/07/07 Python
Python 实现输入任意多个数,并计算其平均值的例子
2019/07/16 Python
Django Rest framework解析器和渲染器详解
2019/07/25 Python
Python3.7安装keras和TensorFlow的教程图解
2020/06/18 Python
css3动画效果小结(推荐)
2016/07/25 HTML / CSS
会计主管岗位职责范文
2013/11/08 职场文书
二年级体育教学反思
2014/01/15 职场文书
大学活动总结模板
2014/07/10 职场文书
教师工作失职检讨书
2014/09/18 职场文书
2014年高中教师工作总结
2014/12/19 职场文书
出纳工作检讨书范文
2014/12/27 职场文书
布达拉宫的导游词
2015/02/02 职场文书
关于观后感的作文
2015/06/18 职场文书
生活委员竞选稿
2015/11/21 职场文书
python 经纬度求两点距离、三点面积操作
2021/06/03 Python
Spring JPA 增加字段执行异常问题及解决
2022/06/10 Java/Android