• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

浅谈tensorflow 中的图片读取和裁剪方式

python 搞代码 4年前 (2022-01-08) 14次浏览 已收录 0个评论

这篇文章主要介绍了浅谈tensorflow 中的图片读取和裁剪方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

一 方式1: skimage

 from skimage import data, io, transform, color import matplotlib.pyplot as plt # io.imread 读出的图片格式是uint8,value是numpy array 类型。 image = data.coffee() image = io.imread(dir) plt.imshow(image) plt.show() io.save('1.jpg-600',image) #保存图像 image_gray = color.rgb2gray(image) #转换为灰度图像 io.save('2.jpg-600',image_gray) # 通过transform.resize()裁剪后的图片是以 float64的格式存储的,数值的取值范围是(0~1) image_ = transform.resize(image,(200,200)) img = image_ * 255 #将图片的取值范围改成(0~255) img = img.astype(np.uint8) img = image_ * 255 #将图片的取值范围改成(0~255) img = img.astype(np.uint8) 

二、方式2:cv2

 import cv2 import matplotlib.pyplot as plt # cv2.imread读出的图片格式是uint8,value也是numpy array 类型。 # 图像数据格式是以BGR的格式进行存储的。需要将存储类型改成RGB 的形式才能正常显示原图的颜色。 image=cv2.imread(dir) b,g,r = cv2.split(image)  #将图像通道分离开 rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新组合 #image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用这个函数直接转换成RGB 形式 plt.imshow(rgb_image) # 通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的, 数值的取值范围是(0~255) image_cv2 = cv2.resize(rgb_image) image=cv2.imread(dir) b,g,r = cv2.split(image)  #将图像通道分离开 rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新组合 #image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用这个函数直接转换成RGB 形式 plt.imshow(rgb_image) # 通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的, 数值的取值范围是(0~255) image_cv2 = cv2.resize(rgb_image) 

补充知识:tensorflow中两种读图及裁剪图片的区别(io.imread和cv2.imread)以及(transform.resize和cv2.resize)

Tensorflow中,在训练图片数据之前,需要先对图片进行预处理,读图和裁剪是最基本的两步。常见的的读图何裁剪分别有两种方式,这里小编将和大家分享下这几种方式的实现以及他们之间的区别。

一、常见的两种读图方式 io.imread() 和 cv2.imread()

1.io.imread 读出的图片格式是uint来源[email protected]搞@^&代*@码网8,value是numpy array 类型。对于RGB 图片,图像数据是以RGB 的格式进行存储的。

2.cv2.imread读出的图片格式是uint8 ,value也是numpy array 类型。唯一的区别是,图像数据格式是以BGR的格式进行存储的。需要将存储类型改成RGB 的形式才能正常显示原图的颜色。特别是制作tfrecord 时,需要将图片通道改成RGB,具体代码如下。

 import cv2 import matplotlib.pyplot as plt from skimage import transform import numpy as np import skimage.io as io train_dir = 'E:/TensorFlow/Project_TF/flower_tfrecord/data/test/roses/timg.jpg-600' '''以cv2方式读取图片''' image=cv2.imread(train_dir) b,g,r = cv2.split(image)  #将图像通道分离开 rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新组合 #image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用这个函数直接转换成RGB 形式 plt.imshow(rgb_image) '''以io.imread方式读取图片''' #image = io.imread(train_dir) #读图并显示 #plt.imshow(image)

二、常见的两种图片裁剪方式 cv2.resize() 和 transform.resize()

1.通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的, 数值的取值范围是(0~255)

2.通过transform.resize()裁剪后的图片是以 float64的格式存储的,数值的取值范围是(0~1)。通常在制作tfrecord 数据集的过程中,我们需要将其转换成numpy array的形式,具体代码如下

 '''以io.imread方式读取图片并使用transform形式裁剪图片''' image = io.imread(train_dir) #读图并显示 plt.imshow(image) image =transform.resize(image, (208, 208)) img = image * 255 #将图片的取值范围改成(0~255) img = img.astype(np.uint8) plt.imshow(img) 

读图和裁剪图片在制作tfrecord数据集时,是很基础的步骤,在接下来,我还将进一步更新如何制作自己的tfrecord数据集,以及tfrecord的读取。如有谬误,还请大家斧正。

以上就是浅谈tensorflow 中的图片读取和裁剪方式的详细内容,更多请关注gaodaima搞代码网其它相关文章!


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:浅谈tensorflow 中的图片读取和裁剪方式

喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址