Python 如何仅从Keras提供的MNIST数据集中选择特定数量的样本?

Python 如何仅从Keras提供的MNIST数据集中选择特定数量的样本?,python,deep-learning,keras,Python,Deep Learning,Keras,我目前正在使用Keras在MNIST数据集上训练卷积神经网络。我正在使用以下格式加载数据集 (X_train, Y_train), (X_test, Y_test) = mnist.load_data() 但是为了减少对所有数据的迭代,我只想从每个类0-9中为X_序列选择前10000个样本,同样地,从Y_序列中选择前10000个样本。如何执行此操作?MNIST数据集显示它返回: Return: 2 tuples: X_train, X_test: uint8 arra

我目前正在使用Keras在MNIST数据集上训练卷积神经网络。我正在使用以下格式加载数据集

(X_train, Y_train), (X_test, Y_test) = mnist.load_data()

但是为了减少对所有数据的迭代,我只想从每个类0-9中为X_序列选择前10000个样本,同样地,从Y_序列中选择前10000个样本。如何执行此操作?

MNIST数据集显示它返回:

Return:

    2 tuples:
        X_train, X_test: uint8 array of grayscale image data with shape (nb_samples, 28, 28).
        y_train, y_test: uint8 array of digit labels (integers in range 0-9) with shape (nb_samples,).
所以你只需要把你想要保留的部分切成薄片。我相信pandas/numpy的语法类似于:

X_train = X_train[:10000,:,:]
X_test = X_test[:10000,:,:]
y_train = y_train[:10000]
y_test  = y_test[:10000]
输出

> 1000 
> 1000 
> 500 
> 500

谢谢我想知道的是,给我前10000个样本,还是给我10类~10000个样本中的前1000个文档说X_序列的形状是nb_样本,28,28,所以第一个索引是样本,所以:10000是前10000个样本。
> 1000 
> 1000 
> 500 
> 500