Scikit learn 文档聚类中的特征提取

Scikit learn 文档聚类中的特征提取,scikit-learn,cluster-analysis,extraction,Scikit Learn,Cluster Analysis,Extraction,我正在使用中的脚本通过聚类进行特征提取 输入是将被聚集的新闻数据和用作标签的新闻类别。输出为质心,带有来自新闻的顶部单词。 如何将每个质心与开始时输入的新闻类别连接起来?在本例中输入类别(标签)的目的是什么?聚类是无监督的方法,不需要标签,但在本例中使用标签 我正在寻找一种提取主题的方法,但想看看不同标签的主题有何不同? 谢谢你能再澄清一下你的问题吗。我无法理解这一点。在链接教程中,真正的标签仅用于计算指标,而不是其他。Vivek感谢您的回答。我现在更明白了。我以为这些标签是用来做别的事的。

我正在使用中的脚本通过聚类进行特征提取

输入是将被聚集的新闻数据和用作标签的新闻类别。输出为质心,带有来自新闻的顶部单词。
如何将每个质心与开始时输入的新闻类别连接起来?在本例中输入类别(标签)的目的是什么?聚类是无监督的方法,不需要标签,但在本例中使用标签

我正在寻找一种提取主题的方法,但想看看不同标签的主题有何不同?
谢谢

你能再澄清一下你的问题吗。我无法理解这一点。在链接教程中,真正的标签仅用于计算指标,而不是其他。Vivek感谢您的回答。我现在更明白了。我以为这些标签是用来做别的事的。