Python 利用位置数据进行预测

Python 利用位置数据进行预测,python,machine-learning,scikit-learn,knn,Python,Machine Learning,Scikit Learn,Knn,我试图开发一部分代码,帮助我根据银行内特定城市分行现有资源的现有生产率(过去12个月/12个月开立的账户数量)预测银行新资源的生产率。例如,如果我想在Agra雇用新资源,该模型可以为我提供Agra分行的现有生产率 下面是我的python笔记本的链接。 我尝试了KNN模型来预测数据,但是模型的精度很低 根据分支机构名称或其位置坐标,是否有更好的方法来预测数据 我使用的是Python3.6笔记本您试图预测数值输出,因此您的问题是回归,而不是分类问题。分类器无法完成这项工作,准确度也不是正确的性能度

我试图开发一部分代码,帮助我根据银行内特定城市分行现有资源的现有生产率(过去12个月/12个月开立的账户数量)预测银行新资源的生产率。例如,如果我想在Agra雇用新资源,该模型可以为我提供Agra分行的现有生产率

下面是我的python笔记本的链接。

我尝试了KNN模型来预测数据,但是模型的精度很低

根据分支机构名称或其位置坐标,是否有更好的方法来预测数据


我使用的是Python3.6笔记本

您试图预测数值输出,因此您的问题是回归,而不是分类问题。分类器无法完成这项工作,准确度也不是正确的性能度量

您需要使用适用于回归的性能指标-请参阅;假设要使用平均绝对误差(MAE),则应将训练循环更改为:

from sklearn.neighbors import KNeighborsRegressor
from sklearn.metrics import mean_absolute_error

#Train Model and Predict  
neigh = KNeighborsRegressor(n_neighbors = n).fit(X_train,y_train)
yhat=neigh.predict(X_test)
err[n-1] = mean_absolute_error(y_test, yhat)

请记住,MAE是一种错误度量,即越低越好,并且您以类似于您的
平均值_acc

欢迎使用SO,这是关于特定编码问题的方式预定义了
err
;请发布到目前为止您尝试过的内容,以及遇到的具体问题。除了数据集的屏幕截图,没有人能做任何事情。谢谢@desertnaut。我已经编辑了这个问题并附上了我的笔记本。我无法获得KNN算法的良好精度。你能看一下代码并提出如何提高预测精度的建议吗;代码应该包括在这里,而不是一些外部回购。当然,将确保同样的进展。因为答案是有帮助的,请接受它-见