Scikit learn 调整后的随机分数和调整后的相互信息分数的输入是什么?

Scikit learn 调整后的随机分数和调整后的相互信息分数的输入是什么?,scikit-learn,data-science,Scikit Learn,Data Science,我阅读了文档,我知道这是labels\u true和labels\u pred,但它们必须是什么形式 对于labels\u pred,我使用kmeans.labels\u,它是一个包含0、1、2或3的numpy数组。 对于标签,我使用top100.Genre。Top100是一个包含不同类型电影的数据帧,共有4种类型。我在某个地方读到,我可以插入这两个标签,两个分数度量将找到一种方法,将数字分配给一个流派 这是真的吗?我得到的值略高于0(比如0.014),所以这对我来说没什么意义。 或者我必须将t

我阅读了文档,我知道这是labels\u true和labels\u pred,但它们必须是什么形式

对于labels\u pred,我使用
kmeans.labels\u
,它是一个包含0、1、2或3的numpy数组。 对于标签,我使用
top100.Genre
。Top100是一个包含不同类型电影的数据帧,共有4种类型。我在某个地方读到,我可以插入这两个标签,两个分数度量将找到一种方法,将数字分配给一个流派

这是真的吗?我得到的值略高于0(比如0.014),所以这对我来说没什么意义。
或者我必须将top100.Genre也转换为numpy数组,并将其名称更改为0、1、2和3吗?我该如何分配每个数字?

我认为分数度量将找到一种方法来匹配分配的标签和预测的标签。根据Scikit学习文档,输入应为数组。在本例中,为您提到的类型(如0,1,2,3)指定类标签。它们可以随机分配

Scikit_learn文档还提到,分数不一定是完美的0,而是接近0。因此,0.014分是可以接受的

下面的链接提供了一些有用的信息: