Machine learning 为什么轮廓评分需要标签作为输入?

Machine learning 为什么轮廓评分需要标签作为输入?,machine-learning,cluster-analysis,Machine Learning,Cluster Analysis,为什么认为它只需要数据是错误的,因为它“输出一个对象与其自身集群(内聚)与其他集群(分离)的相似程度的度量。” 但是,我还需要输入标签(函数本身计算);那么,为什么需要输入标签呢 一个对象与它自己的簇的相似程度 为了计算轮廓,您需要知道样本属于哪个集群 此外: 使用每个样本的平均簇内距离(a)和平均最近簇距离(b)计算轮廓系数。样本的轮廓系数为(b-a)/max(a,b)。为了澄清,b是样本与样本不属于的最近簇之间的距离 您需要标签来了解“集群内”和“最近的集群”的含义。剪影评分是集群质量的指标

为什么认为它只需要数据是错误的,因为它“输出一个对象与其自身集群(内聚)与其他集群(分离)的相似程度的度量。”

但是,我还需要输入标签(函数本身计算);那么,为什么需要输入标签呢

一个对象与它自己的簇的相似程度

为了计算轮廓,您需要知道样本属于哪个集群

此外:

使用每个样本的平均簇内距离(
a
)和平均最近簇距离(
b
)计算轮廓系数。样本的轮廓系数为
(b-a)/max(a,b)
。为了澄清,
b
是样本与样本不属于的最近簇之间的距离


您需要标签来了解“集群内”和“最近的集群”的含义。

剪影评分是集群质量的指标,而不是集群算法。它同时考虑了类间距离和类内距离

要进行该计算,您需要同时提供数据和目标标签(通过无监督方法(如
K-means
)进行估计)