Python 3.x 决策树准确度;ValueError:找到样本数不一致的输入变量;
我试图用给定的数据创建一个决策树。但由于某种原因,Python 3.x 决策树准确度;ValueError:找到样本数不一致的输入变量;,python-3.x,machine-learning,scikit-learn,decision-tree,Python 3.x,Machine Learning,Scikit Learn,Decision Tree,我试图用给定的数据创建一个决策树。但由于某种原因,准确度\u评分给出 ValueError:找到样本数不一致的输入变量: 当我将培训数据拆分为验证(%20)和培训(%80)时 以下是我如何分割数据的: from sklearn.utils import shuffle from sklearn.model_selection import train_test_split # stDt shuffled training set stDt = shuffle(tDt) #divide
准确度\u评分
给出
ValueError:找到样本数不一致的输入变量:
当我将培训数据拆分为验证(%20)和培训(%80)时
以下是我如何分割数据的:
from sklearn.utils import shuffle
from sklearn.model_selection import train_test_split
# stDt shuffled training set
stDt = shuffle(tDt)
#divide shuffled training set to training and validation set
stDt, vtDt = train_test_split(stDt,train_size=0.8, shuffle=False)
print(tDt.shape)
print(stDt.shape)
print(vtDt.shape)
以下是我如何训练数据:
#attibutes and labels of training set
attributesT = stDt.values
labelsT = stDt.label
# Train Decision tree classifiers
from sklearn.tree import DecisionTreeClassifier
dtree1 = DecisionTreeClassifier(min_samples_split = 1.0)
dtree2 = DecisionTreeClassifier(min_samples_split = 3)
dtree3 = DecisionTreeClassifier(min_samples_split = 5)
fited1 = dtree1.fit(attributesT,labelsT)
fited2 = dtree2.fit(attributesT,labelsT)
fited3 = dtree3.fit(attributesT,labelsT)
以下是测试和准确度评分部分:
from sklearn.metrics import accuracy_score
ret1 = fited1.predict(stDt)
ret2 = fited2.predict(stDt)
ret3 = fited3.predict(stDt)
print(accuracy_score(vtDt.label,ret1))
由于您试图将从训练集(
ret1=fited1.predict(stDt)
)生成的预测与验证集的标签(vtDt.label
)进行比较,因此可能会出现错误
以下是获得您的fitted1
模型的培训和验证准确性的正确方法(其他模型也一样):
在不显示图形输出的情况下包含图形的打印命令,这到底有什么意义?其中,这里发布的代码应该是最小的。符号“%20”和“%80”也是非常不幸的,事实上,您使用的是
scikit-learn
,而不是sklearn-pandas
(标记已更正)。。。
# predictions on the training set:
ret1 = fitted1.predict(stDt)
# training accuracy:
accuracy_score(stDt.label,ret1)
# predictions on the validation set:
pred1 = fitted1.predict(vtDt)
# validation accuracy:
accuracy_score(vtDt.label,pred1)