Graph 在Shi-Malik算法中如何选择k?

Graph 在Shi-Malik算法中如何选择k?,graph,cluster-analysis,Graph,Cluster Analysis,我想知道一个人是如何选择一个特定的k的 我们是否选择几个ks并通过其SSE度量对其进行排序? k是否反映了我们为数据假设的聚类数 kind问候Mikey是的,K是我们认为数据中的自然分组数 您可以通过探索特征值来找到K。 一种专门为光谱聚类设计的工具是特征间距启发式法(也称为光谱间距)-聚类数k通常由最大化特征间距(连续特征值之间的差值)的k值给出。i、 e.选择数字k,使所有特征值λ1,λk非常小,但λk+1相对较大。 该特征间隙越大,理想情况下的特征向量越接近,因此谱聚类效果越好。如果你对这

我想知道一个人是如何选择一个特定的k的 我们是否选择几个ks并通过其SSE度量对其进行排序? k是否反映了我们为数据假设的聚类数


kind问候Mikey是的,K是我们认为数据中的自然分组数

您可以通过探索特征值来找到K。
一种专门为光谱聚类设计的工具是特征间距启发式法(也称为光谱间距)-聚类数k通常由最大化特征间距(连续特征值之间的差值)的k值给出。i、 e.选择数字k,使所有特征值λ1,λk非常小,但λk+1相对较大。 该特征间隙越大,理想情况下的特征向量越接近,因此谱聚类效果越好。如果你对这个过程的合理性感兴趣,它是基于微扰理论和谱图论的。 您可以在此处阅读更多内容:

探索自然分组的另一种方法:连接组件的数量和拉普拉斯矩阵的频谱-拉普拉斯矩阵中出现特征值的次数0是图中连接组件的数量。您的关联矩阵可以被视为一个图,然后,尝试查看图中有多少连接的组件。这将使您了解数据的中性结构

此外,正如您所提到的,我们可以设置一个验证标准(例如,SSE),并在不同的K值下查看其值。如果您有一个标记的数据(这在聚类中并不总是如此),并且您知道该标准/质量度量确实有意义,这就很好了