Python 如何为最近邻算法准备此文本文件?
我想准备文本文件,以便在python 2.7中使用k-NN clusstering。我不知道该怎么做。有人能帮忙吗 数据集如下所示:Python 如何为最近邻算法准备此文本文件?,python,python-2.7,machine-learning,nearest-neighbor,Python,Python 2.7,Machine Learning,Nearest Neighbor,我想准备文本文件,以便在python 2.7中使用k-NN clusstering。我不知道该怎么做。有人能帮忙吗 数据集如下所示: 列用逗号分隔,行用换行符分隔。每列描述一名患者。属性按以下顺序排列:血浆血糖、血压、测试结果、皮肤厚度、怀孕次数、胰岛素、体重指数、系谱、年龄。您需要先转换数据(如下),然后使用现成的算法 import numpy as np f1=open(,'r') data=np.zeros(100,6) #rows and cols j=0 for line in f1:
列用逗号分隔,行用换行符分隔。每列描述一名患者。属性按以下顺序排列:血浆血糖、血压、测试结果、皮肤厚度、怀孕次数、胰岛素、体重指数、系谱、年龄。您需要先转换数据(如下),然后使用现成的算法
import numpy as np
f1=open(,'r')
data=np.zeros(100,6) #rows and cols
j=0
for line in f1:
row=line.split(',')
for i in range(len(row)):
x=row[i]
if x=='positive': x=1
elif x=='negative': x=-1
else: x=float(x)
data[i,j]=x
j+=1
你想得到kNN什么?kNN分类?kNN聚类?聚类,抱歉我漏掉了。