Numpy 使用sklearn使用Kneighbors分类器时出错

Numpy 使用sklearn使用Kneighbors分类器时出错,numpy,machine-learning,scikit-learn,knn,Numpy,Machine Learning,Scikit Learn,Knn,我正在对包含28个特征和5000个样本的数据集进行KNN分类: trainingSet = [] testSet = [] imdb_score = range(1,11) print ("Start splitting the dataset ...") splitDataset(path + 'movies.csv', 0.60, trainingSet, testSet) print ("Start KNeighborsClassifier ... \n") neigh = KNeig

我正在对包含28个特征和5000个样本的数据集进行KNN分类:

trainingSet = []
testSet = []
imdb_score = range(1,11)

print ("Start splitting the dataset ...")
splitDataset(path + 'movies.csv', 0.60, trainingSet, testSet)

print ("Start KNeighborsClassifier ... \n")
neigh = KNeighborsClassifier(n_neighbors=5)
neigh.fit(trainingSet, imdb_score)
但是,我遇到了以下错误:

    " samples: %r" % [int(l) for l in lengths])
ValueError: Found input variables with inconsistent numbers of samples: [3362, 10]

我觉得我的代码看起来不错。好心的是,以前有人遇到过这个问题吗?

所以你得到了6000个样本,使用其中的60%,得到了3362个样本(看起来,我没有给你的精确计算加种子)

您可以调用
fit(X,Y)

  • y:{类似数组的稀疏矩阵}
  • 形状的目标值=[n_样本]或[n_样本,n_输出]

由于您的
y=imdb_分数
只是一个包含10个值的列表,这两个规则都不适用,因为它需要是一个包含3362个值的数组状数据结构(列表可以),或者是一个形状数组
(3362,1)

很抱歉,这是一个打字错误。这是5000个样品。