Python 为什么我从头开始构建的KNN算法不起作用?
我尝试从头开始创建KNN算法。我的数据集是一个数据帧。算法总是返回1.0(预测总是与实际结果完全匹配),我担心出了什么问题,尽管我不知道是什么。非常感谢您在识别过程中提供的任何帮助 这是我的密码:Python 为什么我从头开始构建的KNN算法不起作用?,python,pandas,machine-learning,knn,Python,Pandas,Machine Learning,Knn,我尝试从头开始创建KNN算法。我的数据集是一个数据帧。算法总是返回1.0(预测总是与实际结果完全匹配),我担心出了什么问题,尽管我不知道是什么。非常感谢您在识别过程中提供的任何帮助 这是我的密码: def get_neighbors(train,row,n): distances=list() for i in range(len(test)): dist=euclidean_distance(row,train.iloc[i]) dist
def get_neighbors(train,row,n):
distances=list()
for i in range(len(test)):
dist=euclidean_distance(row,train.iloc[i])
distances.append((row,dist))
distances.sort(key=lambda tup: tup[1])
neighbors=list()
for i in range(n):
neighbors.append(distances[i][0])
return neighbors
def predict_classification(train,row,n):
neighbors=get_neighbors(train,row, n)
output_values=[row.iloc[-1]for row in neighbors]
prediction=max(set(output_values),key=output_values.count)
return prediction
import math
def euclidean_distance(row1,row2):
distance = 0.0
for i in range((row1.shape[0])):
distance+=(row1[i] -row2[i]) ** 2
return math.sqrt(distance)
def k_nearest_neighbors(train,test,n):
predictions=list()
for i in range(len(test)):
output=predict_classification(train,test.iloc[i],n)
predictions.append(output)
return(predictions)
train=dataset.iloc[0:500]
test=dataset.iloc[500:600]
df=po.DataFrame()
df["Actual"]=test["Outcome"]
df["Predicted"]=k_nearest_neighbors(train,test,5)
我还没有彻底检查你的代码,但你有几个问题。其中包括:
dist=euclidean_距离(row,train.iloc[i])
distance.append((行,距离))
不是您想要的。追加训练集的行(虽然不是很有效)output\u values=[row.iloc[-1]表示邻居中的行]
n
邻居的索引(而非实际样本),并在投票后将其与您的基本事实进行比较。您不需要将实际样本保存在某个地方(就像您所做的那样)你确定你的数据不应该返回100%的预测吗。有些问题很容易解决!