Python 使用索引向量保存拆分顺序_Python_Numpy_Split_Scikit Learn

Python 使用索引向量保存拆分顺序

python numpy scikit-learn

Python 使用索引向量保存拆分顺序,python,numpy,split,scikit-learn,Python,Numpy,Split,Scikit Learn,我想把数据分成训练和测试，还有一个包含名称的向量（它作为索引和参考）我的数据是： data has a shape of (2440, 3072) labels has a shape of (2440,) from sklearn.cross_validation import train_test_split x_train, x_test, y_train, y_test= train_test_split(data, labels, test_size=0.3) 但是我还想把我的

我想把数据分成训练和测试，还有一个包含名称的向量（它作为索引和参考）

我的数据是：

data has a shape of (2440, 3072) 
labels has a shape of (2440,)

from sklearn.cross_validation import train_test_split
x_train, x_test, y_train, y_test= train_test_split(data, labels, test_size=0.3)

但是我还想把我的

name\u图像

分为

name\u图像

和

name\u图像

测试关于

数据

和

标签

我试过了

  x_train, x_test, y_train, y_test,name_images_train,name_images_test= train_test_split(data, labels,name_images, test_size=0.3)

它不能维持秩序有什么建议吗多谢各位

编辑1：

x_train, x_test, y_train, y_test= train_test_split(data, labels,test_size=0.3, random_state=42)

name_images_train, name_images_test=train_test_split(name_images, 
                                                         test_size=0.3, 
                                                         random_state=42)

EDIT1

不要保留顺序

有多种方法可以实现这一点

最直接的方法是使用

train\u test\u split

的

random\u state

参数。作为：

随机状态：int或RandomState：-
用于随机采样的伪随机数生成器状态

当您修复随机_状态时，为将数组拆分为序列和测试而生成的索引每次都是完全相同的

因此，请将代码更改为：

x_train, x_test, 
y_train, y_test, 
name_images_train, name_images_test=train_test_split(data, labels, name_images, 
                                                     test_size=0.3, 
                                                     random_state=42)

有关随机_状态的更多了解，请参见我的回答：

我不明白。每次调用此

train\u test\u split

时，您希望保留顺序，还是希望在调用

train\u test\u split

时保留

数据

、

标签

和

名称图像

的拆分顺序？我希望保留数据拆分顺序，在同一次通话中标记和命名图片这就是我的答案。这意味着如果train_X获得索引[1,5,7]，那么train_y和name_images_train也将获得相同的索引。如果这仍然不符合你的需要，你能举一个例子说明你想要什么样的输出吗？你也尝试了以下方法，但都不起作用：x\u-train，x\u-test，y\u-train，y\u-test，name\u-images\u-train，name\u-images\u-test=train\u-test\u-split（数据像素、类、图像名称、测试大小=0.3、随机状态=42）

x_train, x_test, 
y_train, y_test, 
name_images_train, name_images_test=train_test_split(data, labels, name_images, 
                                                     test_size=0.3, 
                                                     random_state=42)