Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/apache-kafka/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python:集群入门_Python_Scipy_Cluster Analysis - Fatal编程技术网

Python:集群入门

Python:集群入门,python,scipy,cluster-analysis,Python,Scipy,Cluster Analysis,我试图理解python的层次集群模块中的链接函数的功能(无法从文档或其他更复杂的问题中理解) 我尝试了一个随机向量的例子。我不知道从哪里开始弄清楚这是怎么回事,为什么链接中有12个数字,它们是什么 多谢各位 dist_vec=np.random.randint(1,10,6) print dist_vec [4 2 2 6 5 1] # create linkage Z = linkage(dist_vec, method='single') # distance = 0.8 as cuto

我试图理解python的层次集群模块中的链接函数的功能(无法从文档或其他更复杂的问题中理解)

我尝试了一个随机向量的例子。我不知道从哪里开始弄清楚这是怎么回事,为什么链接中有12个数字,它们是什么

多谢各位

dist_vec=np.random.randint(1,10,6)
print dist_vec
[4 2 2 6 5 1]

# create linkage
Z = linkage(dist_vec, method='single')

# distance = 0.8 as cutoff
clusters = fcluster(Z, 0.8, criterion='distance')

print Z
[[ 2.  3.  1.  2.]
[ 0.  4.  2.  3.]
[ 1.  5.  4.  4.]]

scipy文档中解释了输出格式

这是两个集群ID,高度和点数

我强烈建议从二维欧几里德玩具数据开始。不是随机距离矩阵(不一致)