Python 如何用Keras训练多类图像分类器
我正在学习2类图像分类教程,并希望将其转换为多类分类器 我试图训练一个模型,从17个等级预测手表的品牌。我在50个纪元后的准确率只有21.88%,所以我不确定我到底哪里做错了,或者我是否做对了。Python 如何用Keras训练多类图像分类器,python,machine-learning,keras,deep-learning,Python,Machine Learning,Keras,Deep Learning,我正在学习2类图像分类教程,并希望将其转换为多类分类器 我试图训练一个模型,从17个等级预测手表的品牌。我在50个纪元后的准确率只有21.88%,所以我不确定我到底哪里做错了,或者我是否做对了。 这是我的代码: 所有图像都位于/data或/valid文件夹下各自独立的文件夹中。 例如:../watch finder/data/armani Ex2:../watch finder/data/gucci import numpy as np import matplotlib.pyplot as p
这是我的代码: 所有图像都位于/data或/valid文件夹下各自独立的文件夹中。
例如:../watch finder/data/armani
Ex2:../watch finder/data/gucci
import numpy as np
import matplotlib.pyplot as plt
import os
import cv2
from keras.utils import np_utils
from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Activation, Dropout, Flatten, Dense
from keras import backend as K
import keras.optimizers
img_width, img_height = 210, 210
train_data_dir = 'C:/Users/Adrian/Desktop/watch finder/data'
validation_data_dir = 'C:/Users/Adrian/Desktop/watch finder/valid'
nb_train_samples = 4761
nb_validation_samples = 612
epochs = 50
batch_size = 16
model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape=input_shape))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Conv2D(64, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Flatten())
model.add(Dense(64))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(17))
model.add(Activation('softmax'))
model.compile(loss='categorical_crossentropy',
optimizer='rmsprop',
metrics=['accuracy'])
train_datagen = ImageDataGenerator(
rescale=1. / 255,
shear_range=0.2,
zoom_range=0.2,
horizontal_flip=True)
test_datagen = ImageDataGenerator(rescale=1. / 255)
train_generator = train_datagen.flow_from_directory(
train_data_dir,
target_size=(img_width, img_height),
batch_size=batch_size,
class_mode='categorical')
validation_generator = test_datagen.flow_from_directory(
validation_data_dir,
target_size=(img_width, img_height),
batch_size=batch_size,
class_mode='categorical')
model.fit_generator(
train_generator,
samples_per_epoch=nb_train_samples // batch_size,
epochs=epochs,
validation_data=validation_generator,
validation_steps=nb_validation_samples // batch_size)
这是我的第一个时代:
Epoch 1/50
18/18 [==============================] - 8s 422ms/step - loss: 4.1104 - accuracy: 0.0833 - val_loss: 2.8369 - val_accuracy: 0.0592
这是我的第50个/最后一个纪元:
Epoch 50/50
18/18 [==============================] - 7s 404ms/step - loss: 2.4840 - accuracy: 0.2188 - val_loss: 3.0823 - val_accuracy: 0.1795
我相当肯定我在这里做错了什么,但我对深度学习还很陌生,所以我不确定那是什么。
感谢所有的帮助
此外,每个品牌的手表都有300-400个图像,每个图像大小都是210x210。从高层次来看,您的方法似乎没有什么问题 训练是在第50世纪停止了,还是还在学习?如果是这样,那么您可能需要提高学习速度,以便更快地进行训练 您还需要尝试不同的体系结构,并开始调整超参数 我想说的另一点是,你的图片数量非常少。尝试使用已建立的体系结构,您可以为其找到预训练的模型。这些可以帮助您显著提高绩效 最后一点要注意的是,由于你有17门课,如果你的模型是随机预测的,那么你的准确率将略低于6%。这意味着你的模型至少学到了一些东西