python sklearn交叉验证/标签数量与样本数量不匹配

python sklearn交叉验证/标签数量与样本数量不匹配,python,scikit-learn,cross-validation,Python,Scikit Learn,Cross Validation,我正在学习一门关于机器学习的课程,我想把数据分成训练集和测试集。我想将其拆分,在其上使用Decisiontree进行培训,然后打印出测试集的分数。给出了代码中的交叉验证参数。有人知道我做错了什么吗 我得到的错误如下: Traceback (most recent call last): File "/home/stephan/ud120-projects/validation/validate_poi.py", line 36, in <module> clf = clf

我正在学习一门关于机器学习的课程,我想把数据分成训练集和测试集。我想将其拆分,在其上使用Decisiontree进行培训,然后打印出测试集的分数。给出了代码中的交叉验证参数。有人知道我做错了什么吗

我得到的错误如下:

Traceback (most recent call last):
  File "/home/stephan/ud120-projects/validation/validate_poi.py", line 36, in <module>
    clf = clf.fit(features_train, labels_train)
  File "/home/stephan/.local/lib/python2.7/site-packages/sklearn/tree/tree.py", line 221, in fit
    "number of samples=%d" % (len(y), n_samples))
ValueError: Number of labels=29 does not match number of samples=66

您的变量似乎与的返回模式不匹配

尝试:


您需要通过列车测试分割功能中的测试大小=0.5

train_test_split(...,test_size=0.5,...)

好的,我想既然所有这些都在作业中给出了,它们中不太可能有错误:(
features_train, features_test, labels_train, labels_test = ...
train_test_split(...,test_size=0.5,...)