Python中的快速数据集扩充-深度学习

Python中的快速数据集扩充-深度学习,python,numpy,machine-learning,deep-learning,data-augmentation,Python,Numpy,Machine Learning,Deep Learning,Data Augmentation,我正在从事一个需要数据扩充的项目。我想水平翻转图像并将其添加到训练数据数组中。问题是有超过10000张图片 这是用于手动翻转长度为“size”的数组序列图像中的每个图像(2d numpy数组)的代码 for img in range(0, size): flip = np.flip(train_images[img], axis=1) np.append(train_images, flip) np.append(train_labels, train_labels[img]) 这

我正在从事一个需要数据扩充的项目。我想水平翻转图像并将其添加到训练数据数组中。问题是有超过10000张图片

这是用于手动翻转长度为“size”的数组序列图像中的每个图像(2d numpy数组)的代码

for img in range(0, size):
  flip = np.flip(train_images[img], axis=1)
  np.append(train_images, flip)
  np.append(train_labels, train_labels[img])
这需要相当长的时间。是否有任何库函数或更快的方法来计算新图像并将其添加到阵列中而无需多线程


提前感谢您的评论。

我以系统的方式使用该库进行数据扩充。这是非常有用的,并有一个伟大的设计情况下,你需要做多个增强同一图像。我确实有一点学习曲线,但非常值得。

在完成一些其他机器学习项目后,我发现Keras下的这个非常有用的工具叫做ImageDataGenerator()。该生成器可以应用各种级别的增强功能

# instantiate data generator for horizontal flips
datagen = ImageDataGenerator(horizontal_flip=True)
这将对生成的图像随机应用翻转。请注意,由于我们使用的是生成器,因此我们不再调用.fit()来训练模型,而是调用.fit_generator()