Scikit learn 调整后的随机分数和调整后的相互信息分数的输入是什么？_Scikit Learn_Data Science

Scikit learn 调整后的随机分数和调整后的相互信息分数的输入是什么？

scikit-learn

Scikit learn 调整后的随机分数和调整后的相互信息分数的输入是什么？,scikit-learn,data-science,Scikit Learn,Data Science,我阅读了文档，我知道这是labels\u true和labels\u pred，但它们必须是什么形式对于labels\u pred，我使用kmeans.labels\u，它是一个包含0、1、2或3的numpy数组。对于标签，我使用top100.Genre。Top100是一个包含不同类型电影的数据帧，共有4种类型。我在某个地方读到，我可以插入这两个标签，两个分数度量将找到一种方法，将数字分配给一个流派这是真的吗？我得到的值略高于0（比如0.014），所以这对我来说没什么意义。或者我必须将t

我阅读了文档，我知道这是labels\u true和labels\u pred，但它们必须是什么形式

对于labels\u pred，我使用

kmeans.labels\u

，它是一个包含0、1、2或3的numpy数组。对于标签，我使用

top100.Genre

。Top100是一个包含不同类型电影的数据帧，共有4种类型。我在某个地方读到，我可以插入这两个标签，两个分数度量将找到一种方法，将数字分配给一个流派

这是真的吗？我得到的值略高于0（比如0.014），所以这对我来说没什么意义。

或者我必须将top100.Genre也转换为numpy数组，并将其名称更改为0、1、2和3吗？我该如何分配每个数字？

我认为分数度量将找到一种方法来匹配分配的标签和预测的标签。根据Scikit学习文档，输入应为数组。在本例中，为您提到的类型（如0,1,2,3）指定类标签。它们可以随机分配

Scikit_learn文档还提到，分数不一定是完美的0，而是接近0。因此，0.014分是可以接受的

下面的链接提供了一些有用的信息：