Python 如何用Keras训练多类图像分类器

Python 如何用Keras训练多类图像分类器,python,machine-learning,keras,deep-learning,Python,Machine Learning,Keras,Deep Learning,我正在学习2类图像分类教程,并希望将其转换为多类分类器 我试图训练一个模型,从17个等级预测手表的品牌。我在50个纪元后的准确率只有21.88%,所以我不确定我到底哪里做错了,或者我是否做对了。 这是我的代码: 所有图像都位于/data或/valid文件夹下各自独立的文件夹中。 例如:../watch finder/data/armani Ex2:../watch finder/data/gucci import numpy as np import matplotlib.pyplot as p

我正在学习2类图像分类教程,并希望将其转换为多类分类器

我试图训练一个模型,从17个等级预测手表的品牌。我在50个纪元后的准确率只有21.88%,所以我不确定我到底哪里做错了,或者我是否做对了。

这是我的代码:

所有图像都位于/data或/valid文件夹下各自独立的文件夹中。
例如:../watch finder/data/armani
Ex2:../watch finder/data/gucci

import numpy as np
import matplotlib.pyplot as plt
import os
import cv2
from keras.utils import np_utils

from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Activation, Dropout, Flatten, Dense
from keras import backend as K
import keras.optimizers

img_width, img_height = 210, 210

train_data_dir = 'C:/Users/Adrian/Desktop/watch finder/data'
validation_data_dir = 'C:/Users/Adrian/Desktop/watch finder/valid'
nb_train_samples = 4761
nb_validation_samples = 612
epochs = 50
batch_size = 16

model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape=input_shape))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Conv2D(64, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Flatten())
model.add(Dense(64))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(17))
model.add(Activation('softmax'))

model.compile(loss='categorical_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])

train_datagen = ImageDataGenerator(
    rescale=1. / 255,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True)

test_datagen = ImageDataGenerator(rescale=1. / 255)

train_generator = train_datagen.flow_from_directory(
    train_data_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    class_mode='categorical')

validation_generator = test_datagen.flow_from_directory(
    validation_data_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    class_mode='categorical')
model.fit_generator(
    train_generator,
    samples_per_epoch=nb_train_samples // batch_size,
    epochs=epochs,
    validation_data=validation_generator,
    validation_steps=nb_validation_samples // batch_size)
这是我的第一个时代:

Epoch 1/50
18/18 [==============================] - 8s 422ms/step - loss: 4.1104 - accuracy: 0.0833 - val_loss: 2.8369 - val_accuracy: 0.0592
这是我的第50个/最后一个纪元:

Epoch 50/50
18/18 [==============================] - 7s 404ms/step - loss: 2.4840 - accuracy: 0.2188 - val_loss: 3.0823 - val_accuracy: 0.1795
我相当肯定我在这里做错了什么,但我对深度学习还很陌生,所以我不确定那是什么。 感谢所有的帮助


此外,每个品牌的手表都有300-400个图像,每个图像大小都是210x210。

从高层次来看,您的方法似乎没有什么问题

训练是在第50世纪停止了,还是还在学习?如果是这样,那么您可能需要提高学习速度,以便更快地进行训练

您还需要尝试不同的体系结构,并开始调整超参数

我想说的另一点是,你的图片数量非常少。尝试使用已建立的体系结构,您可以为其找到预训练的模型。这些可以帮助您显著提高绩效

最后一点要注意的是,由于你有17门课,如果你的模型是随机预测的,那么你的准确率将略低于6%。这意味着你的模型至少学到了一些东西