Numpy OpenCV-将uint8图像转换为浮点32标准化图像_Numpy_Opencv_Image Processing_Python Imaging Library

Numpy OpenCV-将uint8图像转换为浮点32标准化图像

numpy opencv image-processing

Numpy OpenCV-将uint8图像转换为浮点32标准化图像,numpy,opencv,image-processing,python-imaging-library,Numpy,Opencv,Image Processing,Python Imaging Library,我试图转换Keras-DarkNet代码的一部分，以使代码运行得更快。以下是我试图优化的代码： model_image_size = (416, 416) import cv2 from PIL import Image frame = cv2.imread("test.png", cv2.IMREAD_COLOR) im = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB) im = Image.fromarray(im).crop((1625, 785,

我试图转换Keras-DarkNet代码的一部分，以使代码运行得更快。以下是我试图优化的代码：

model_image_size = (416, 416)

import cv2
from PIL import Image

frame = cv2.imread("test.png", cv2.IMREAD_COLOR)

im = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
im = Image.fromarray(im).crop((1625, 785, 1920, 1080))  # crop ROI

resized_image = im.resize(tuple(reversed(model_image_size)), Image.BICUBIC)
image_data = np.array(resized_image, dtype='float32')

image_data /= 255.
image_data = np.expand_dims(image_data, 0)  # Add batch dimension.

return image_data

这是我在不使用中间PIL转换以减少时间的情况下实现相同输出的尝试：

model_image_size = (416, 416)

import cv2

frame = cv2.imread("test.png", cv2.IMREAD_COLOR)

frame = frame[785:1080,1625:1920]  # crop ROI
im = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)

resized_image = cv2.resize(im, model_image_size, interpolation = cv2.INTER_CUBIC)

resized_image /= 255.
image_data = np.expand_dims(resized_image, 0)  # Add batch dimension.

return image_data

但是，在运行代码时，它将返回：

resized_image /= 255.
TypeError: ufunc 'true_divide' output (typecode 'd') could not be coerced to provided output parameter (typecode 'B') according to the casting rule ''same_kind''

在规范化之前，我似乎需要将

uint8

类型更改为

float32

，但我不确定如何使用OpenCV实现它。

您的问题是，您正在使用

/=

对同一变量进行分割和赋值。Numpy希望在执行此操作时，数组的类型与以前相同，但使用的是一个浮点数，这将更改值类型

要解决此问题，您可以执行以下操作：

resized_image =  resized_image / 255.

resized_image.astype(np.float32)

它应该会起作用。但您必须注意，它会将矩阵转换为

dtype=float64

。要将其转换为

float32

，您可以执行以下操作：

resized_image =  resized_image / 255.

resized_image.astype(np.float32)

或

np

应来自：

import numpy as np

您可以使用

resized_image.astype（np.float32）

将

resized_image

数据从

unit8

转换为

float32

，然后继续进行规范化和其他操作：

frame = cv2.imread("yourfile.png")

frame = frame[200:500,400:1000]  # crop ROI
im = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)

model_image_size = (416, 416)
resized_image = cv2.resize(im, model_image_size, interpolation = cv2.INTER_CUBIC)
resized_image = resized_image.astype(np.float32)
resized_image /= 255.

image_data = np.expand_dims(resized_image, 0)  # Add batch dimension.

使用

resized\u image.astype（）

转换为float，然后继续？OP需要

dtype='float32'

。将一个8位无符号整数除以255，再回溯到整数，结果大部分为零。看起来没用。@CrisLuengo没错，我会把它改得更有意义