Python Dlib功能阵列作为CNN和预测的输入
我正在尝试使用CNN和dlib特征提取器创建一个人脸识别应用程序。我想做的是从同一个人的一堆照片中提取特征,然后将阵列发送到我的CNN,CNN将为此人生成一个2类分类器 如何将其更改为接受dlib功能阵列,predict方法会是什么样子,数据应该如何格式化 到目前为止,我的网络配置为将图像作为输入,但我不确定如何将其更改为使用功能阵列Python Dlib功能阵列作为CNN和预测的输入,python,machine-learning,keras,opencv3.0,dlib,Python,Machine Learning,Keras,Opencv3.0,Dlib,我正在尝试使用CNN和dlib特征提取器创建一个人脸识别应用程序。我想做的是从同一个人的一堆照片中提取特征,然后将阵列发送到我的CNN,CNN将为此人生成一个2类分类器 如何将其更改为接受dlib功能阵列,predict方法会是什么样子,数据应该如何格式化 到目前为止,我的网络配置为将图像作为输入,但我不确定如何将其更改为使用功能阵列 model = Sequential() model.add(Conv2D(32, (3, 3), input_shape=input_shape)) model
model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape=input_shape))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Conv2D(64, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Flatten())
model.add(Dense(64))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(1))
model.add(Activation('sigmoid'))
model.compile(loss='binary_crossentropy', optimizer='rmsprop', metrics=['accuracy'])
train_datagen = ImageDataGenerator(rescale=1. / 255, shear_range=0.2, zoom_range=0.2, horizontal_flip=True)
test_datagen = ImageDataGenerator(rescale=1. / 255)
train_generator = train_datagen.flow_from_directory(train_data_dir, target_size=(img_width, img_height), batch_size=batch_size, class_mode='binary', shuffle=True)
print(train_generator.class_indices)
validation_generator = test_datagen.flow_from_directory(validation_data_dir, target_size=(img_width, img_height), batch_size=batch_size, class_mode='binary', shuffle=True)
print(validation_generator.class_indices)
model.fit_generator(train_generator, shuffle=True, steps_per_epoch=train_samples // batch_size, epochs=epochs, callbacks=[tensorboard], validation_data=validation_generator, validation_steps=validation_samples // batch_size)
model.save('Models/model.h5')
我希望这样做的方式是使用一个程序,将每张照片中每个人脸的特征提取到一个文件中,我的CNN可以使用该文件创建“是/否”分类器文件,稍后可以用于预测。这是第一次尝试,当然需要更多的工程。你可以把美国有线电视新闻网的第一个卷积层看作是“特征提取”层,最后一个完全连接的层是“分类”层。
然后像往常一样编译和安装,但您需要一个
[i1,i2]
并替换ImageDataGenerator
。如果您只想使用功能而不想使用图像,那么体系结构将更简单:忘记卷积部分,试试密集网络。您对使用哪种体系结构已经有了想法吗?@dcolazin这是什么意思?
import tensorflow as tf
import tensorflow.keras.layers as ll
i1 = ll.Input(input_shape1) #the images
x = ll.Conv2D(32, (3, 3),activation='relu')(i1)
x = ll.MaxPooling2D(pool_size=(2, 2))(x)
x = ll.Conv2D(32, (3, 3),activation='relu')(x)
x = ll.MaxPooling2D(pool_size=(2, 2))(x)
x = ll.Conv2D(64, (3, 3),activation='relu')(x)
x = ll.MaxPooling2D(pool_size=(2, 2))(x)
i2 = ll.Input(input_shape2) #the feature manually extracted
y = ll.Concatenate([x,i2])
y = ll.Flatten()(y)
y = ll.Dense(64,activation='relu')(y)
y = ll.Dropout(0.5)(y)
y = ll.Dense(1, activation='sigmoid')(y)
model = tf.keras.models.Model(inputs = [i1,i2], outputs = y)