Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/324.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/arrays/12.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 已纠正-列车试验的数据大小不同_Python_Arrays_Numpy_Machine Learning_Training Data - Fatal编程技术网

Python 已纠正-列车试验的数据大小不同

Python 已纠正-列车试验的数据大小不同,python,arrays,numpy,machine-learning,training-data,Python,Arrays,Numpy,Machine Learning,Training Data,我在形状(500,32)中输入变量X,在形状(422750,3)中输出变量y。我需要用这些变量训练一个机器学习模型。当我像这样使用train\u test\u split时 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=123) 我马上就明白了 ValueError:找到样本数不一致的输入变量:[500422] 正如所料。我知道培训和测试样本的大小必须相同,我想知道是

我在形状(500,32)中输入变量X,在形状(422750,3)中输出变量y。我需要用这些变量训练一个机器学习模型。当我像这样使用train\u test\u split时

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=123)
我马上就明白了

ValueError:找到样本数不一致的输入变量:[500422]

正如所料。我知道培训和测试样本的大小必须相同,我想知道是否有什么方法可以解决这个问题?多谢各位


编辑:我知道为了训练我的机器学习模型,我的数据应该满足X.shape[0]==Y.shape[0],这解决了整个问题,并表明我走错了路。

根据我的理解,X和Y的第一维度可能是批量大小,对吗? 我在这个火车上做了一个小测试

import numpy as np
import sklearn.model_selection as mod

X = np.random.randn(500,422)
Y = np.random.randn(500,750,3)
X_train, X_test, y_train, y_test = mod.train_test_split(X, Y, test_size=0.25,random_state=123)

print(X_train.shape, y_train.shape)
然后我得到了结果: (375422)(375750,3)


也许你应该把你的X和(422,32)对齐。

所以,如果我理解正确的话,你的一些观察结果没有输出y。对吗?因此,您可以使用半监督学习的一些技术。事实上,我的X和y值是两个不同图像的像素阵列@Nimas为什么要像这样分割两个像素
train\u test\u split
需要
X.shape[0]==Y.shape[0]
我知道如何分割数据。如果你有一个更适合我的想法,我想听听@FrighteraWell我该怎么做?X和y都是两个不同图像的像素变量@lunacancerSo我猜你有两组图片,X中的每个图片都是灰度(500,32,1),y中的每个图片都是RGB(422750,3)?嗯,当使用CNN网络或类似的东西时,我总是用一个四维张量,第一维是批量大小,最后三维是像素。哦,你可能是对的,不幸的是,我不允许使用任何深度学习技术。