Numpy 使用sklearn使用Kneighbors分类器时出错_Numpy_Machine Learning_Scikit Learn_Knn

Numpy 使用sklearn使用Kneighbors分类器时出错

numpy machine-learning scikit-learn

Numpy 使用sklearn使用Kneighbors分类器时出错,numpy,machine-learning,scikit-learn,knn,Numpy,Machine Learning,Scikit Learn,Knn,我正在对包含28个特征和5000个样本的数据集进行KNN分类： trainingSet = [] testSet = [] imdb_score = range(1,11) print ("Start splitting the dataset ...") splitDataset(path + 'movies.csv', 0.60, trainingSet, testSet) print ("Start KNeighborsClassifier ... \n") neigh = KNeig

我正在对包含28个特征和5000个样本的数据集进行KNN分类：

trainingSet = []
testSet = []
imdb_score = range(1,11)

print ("Start splitting the dataset ...")
splitDataset(path + 'movies.csv', 0.60, trainingSet, testSet)

print ("Start KNeighborsClassifier ... \n")
neigh = KNeighborsClassifier(n_neighbors=5)
neigh.fit(trainingSet, imdb_score)

但是，我遇到了以下错误：

    " samples: %r" % [int(l) for l in lengths])
ValueError: Found input variables with inconsistent numbers of samples: [3362, 10]

我觉得我的代码看起来不错。好心的是，以前有人遇到过这个问题吗？

所以你得到了6000个样本，使用其中的60%，得到了3362个样本（看起来，我没有给你的精确计算加种子）

您可以调用

fit（X，Y）

：

```
y:{类似数组的稀疏矩阵}
```

形状的目标值=[n_样本]或[n_样本，n_输出]

由于您的

y=imdb_分数

只是一个包含10个值的列表，这两个规则都不适用，因为它需要是一个包含3362个值的数组状数据结构（列表可以），或者是一个形状数组

（3362，1）

很抱歉，这是一个打字错误。这是5000个样品。