Machine learning 验证准确性不会增加培训ResNet50_Machine Learning_Keras_Deep Learning

Machine learning 验证准确性不会增加培训ResNet50

machine-learning keras deep-learning

Machine learning 验证准确性不会增加培训ResNet50,machine-learning,keras,deep-learning,Machine Learning,Keras,Deep Learning,我正在使用ResNet50模型进行微调，以便使用数据处理进行人脸识别，但观察到模型精度在提高，但验证精度从一开始就不重要，我不知道哪里出错，请查看我的代码我已经尝试过操作我添加的顶层，但是没有帮助 import os os.environ['KERAS_BACKEND'] = 'tensorflow' from keras.applications import ResNet50 from keras.models import Sequential from keras.layers imp

我正在使用ResNet50模型进行微调，以便使用数据处理进行人脸识别，但观察到模型精度在提高，但验证精度从一开始就不重要，我不知道哪里出错，请查看我的代码

我已经尝试过操作我添加的顶层，但是没有帮助

import os
os.environ['KERAS_BACKEND'] = 'tensorflow'
from keras.applications import ResNet50
from keras.models import Sequential
from keras.layers import Dense, Flatten, GlobalAveragePooling2D,Input,Dropout

num_classes = 13

base = ResNet50(include_top=False, weights='resnet50_weights_tf_dim_ordering_tf_kernels_notop.h5',input_tensor=Input(shape=(100,100,3)))
from keras.models import Model

x = base.output

#x = GlobalAveragePooling2D()(x)

x = Flatten()(x)

x = Dense(1024, activation = 'relu')(x)

x = Dropout(0.5)(x)

predictions = Dense(13, activation='softmax')(x)

model = Model(inputs=base.input, outputs=predictions)

for layers in base.layers:
    layers.trainable= False

model.compile(optimizer='sgd', loss='categorical_crossentropy', metrics=['accuracy'])
from keras.preprocessing.image import ImageDataGenerator

train_generator = ImageDataGenerator(featurewise_center=True,
                                rotation_range=20,
                                rescale=1./255,
                                shear_range=0.2,
                                zoom_range=0.2,
                                width_shift_range=0.2,
                                height_shift_range=0.2,
                                horizontal_flip=True)

test_generator = ImageDataGenerator(rescale=1./255)

from sklearn.model_selection import train_test_split

x_train,x_test,y_train,y_test = train_test_split(image,label,test_size=0.2,shuffle=True,random_state=0)

train_generator.fit(x_train)
test_generator.fit(x_test)

model.fit_generator(train_generator.flow(x_train,y_train,batch_size=32),
                       steps_per_epoch =10,epochs=50, 
                    validation_data=test_generator.flow(x_test,y_test))

输出：

Epoch 19/50
10/10 [==============================] - 105s 10s/step - loss: 1.9387 - acc: 0.3803 - val_loss: 2.6820 - val_acc: 0.0709
Epoch 20/50
10/10 [==============================] - 107s 11s/step - loss: 2.0725 - acc: 0.3230 - val_loss: 2.6689 - val_acc: 0.0709
Epoch 21/50
10/10 [==============================] - 103s 10s/step - loss: 1.8884 - acc: 0.3375 - val_loss: 2.6677 - val_acc: 0.0709
Epoch 22/50
10/10 [==============================] - 95s 10s/step - loss: 1.8265 - acc: 0.4051 - val_loss: 2.6799 - val_acc: 0.0709
Epoch 23/50
10/10 [==============================] - 100s 10s/step - loss: 1.8346 - acc: 0.3812 - val_loss: 2.6929 - val_acc: 0.0709
Epoch 24/50
10/10 [==============================] - 102s 10s/step - loss: 1.9547 - acc: 0.3352 - val_loss: 2.6952 - val_acc: 0.0709
Epoch 25/50
10/10 [==============================] - 104s 10s/step - loss: 1.9472 - acc: 0.3281 - val_loss: 2.7168 - val_acc: 0.0709
Epoch 26/50
10/10 [==============================] - 103s 10s/step - loss: 1.8818 - acc: 0.4063 - val_loss: 2.7071 - val_acc: 0.0709
Epoch 27/50
10/10 [==============================] - 106s 11s/step - loss: 1.8053 - acc: 0.4000 - val_loss: 2.7059 - val_acc: 0.0709
Epoch 28/50
10/10 [==============================] - 104s 10s/step - loss: 1.9601 - acc: 0.3493 - val_loss: 2.7104 - val_acc: 0.0709

这是因为我只是直接添加了完全连接的层，而没有首先对其进行培训，正如keras博客中提到的，

为了执行微调，所有层都应该从经过适当训练的权重开始：例如，您不应该将随机初始化的完全连接的网络放在预先训练的卷积基上。这是因为随机初始化权重触发的大梯度更新会破坏卷积基中的学习权重。在我们的例子中，这就是为什么我们首先训练顶级分类器，然后才开始微调它旁边的卷积权重

因此，答案是首先分别训练顶层模型，然后创建一个新模型，该模型具有ResNet50模型及其权重，顶层模型及其权重位于resnet模型（基本模型）之上，然后通过冻结基本模型（ResNet50）对其进行训练以及基本模型的最后一层。

请发布一个示例好吗？是的，您能提供您的代码吗？我也有同样的问题，但不知道如何分别训练顶层。嗨@NECben067，目前我无法发布代码，因为我已经很久没有发布代码了，但我可以从上面的示例中理解它。因此，我们的想法是在数据集上训练一个具有1个密集层的简单顺序模型（根据上面的示例，它完全取决于您），然后将该模型添加到ResNet50基础模型的顶部。执行此操作的原因如上所述。@NECben067 New link详细描述了如何训练顶级分类器以及完整的代码