Python Tensorflow估计器值错误:逻辑项和标签必须具有相同的形状((?,1)vs(?,)
我对ML比较陌生,我想先从keras开始。在这里,我使用二进制交叉熵将电影评论分为正面和负面。所以,当我试图用tensorflow估计器包装我的keras模型时,我得到了错误: Tensorflow估计器值错误:逻辑项和标签必须具有相同的形状((?,1)vs(?,) 我使用乙状结肠激活作为我的最后一层,我想我遗漏了一些琐碎的东西。有什么帮助吗Python Tensorflow估计器值错误:逻辑项和标签必须具有相同的形状((?,1)vs(?,),python,tensorflow,keras,Python,Tensorflow,Keras,我对ML比较陌生,我想先从keras开始。在这里,我使用二进制交叉熵将电影评论分为正面和负面。所以,当我试图用tensorflow估计器包装我的keras模型时,我得到了错误: Tensorflow估计器值错误:逻辑项和标签必须具有相同的形状((?,1)vs(?,) 我使用乙状结肠激活作为我的最后一层,我想我遗漏了一些琐碎的东西。有什么帮助吗 from tensorflow import keras import tensorflow as tf print("Tensorflow {} loa
from tensorflow import keras
import tensorflow as tf
print("Tensorflow {} loaded".format(tf.__version__))
import numpy as np
keras.__version__
from keras.datasets import imdb
(train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000)
def vectorize_sequences(sequences, dimension=10000):
# Create an all-zero matrix of shape (len(sequences), dimension)
results = np.zeros((len(sequences), dimension))
for i, sequence in enumerate(sequences):
results[i, sequence] = 1. # set specific indices of results[i] to 1s
return results.astype('float32')
# Our vectorized training data
x_train = vectorize_sequences(train_data)
# Our vectorized test data
x_test = vectorize_sequences(test_data)
# Our vectorized labels
y_train = np.asarray(train_labels).astype('float32')
y_test = np.asarray(test_labels).astype('float32')
x_val = x_train[:10000]
partial_x_train = x_train[10000:]
y_val = y_train[:10000]
partial_y_train = y_train[10000:]
model = keras.models.Sequential()
model.add(keras.layers.Dense(16, activation='relu', input_shape=(10000,), name='reviews'))
model.add(keras.layers.Dense(16, activation='relu'))
model.add(keras.layers.Dense(1, activation='sigmoid'))
model.compile(optimizer='rmsprop',
loss='binary_crossentropy',
metrics=['accuracy'])
estimator_model = keras.estimator.model_to_estimator(keras_model=model)
def input_function(features,labels=None,shuffle=False,epochs=None,batch_size=None):
input_fn = tf.estimator.inputs.numpy_input_fn(
x={"reviews_input": features},
y=labels,
shuffle=shuffle,
num_epochs=epochs,
batch_size=batch_size
)
return input_fn
estimator_model.train(input_fn=input_function(partial_x_train, partial_y_train, True,20,512))
score = estimator_model.evaluate(input_function(x_val, labels=y_val))
print(score)
应将标签重塑为二维张量(第一个维度为批次维度,第二个维度为标量标签):
使用model.summary()检查您的网络 最终,您需要精简网络以获得与类相同的输出。 例如,对需要的数字进行OCR,并最终输出稠密(10)(对于数字0到9)
例如,描述狗和猫的特征。最后一层必须有两个输出(0-dog,1-cat)只有使用softmax+交叉熵时,最后一句才是真的。使用sigmoid+二元交叉熵,最后的致密层应该有一个节点。@kelkka你说得对……我在一个项目中尝试了你的建议(我不是这个问题的原始作者),它确实有效。。。竖起大拇指!
# Our vectorized labels
y_train = np.asarray(train_labels).astype('float32').reshape((-1,1))
y_test = np.asarray(test_labels).astype('float32').reshape((-1,1))