Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/backbone.js/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 我需要为我的数据集实现肘部方法,以找到k-means聚类所需的最佳聚类_Python_K Means_Tfidfvectorizer - Fatal编程技术网

Python 我需要为我的数据集实现肘部方法,以找到k-means聚类所需的最佳聚类

Python 我需要为我的数据集实现肘部方法,以找到k-means聚类所需的最佳聚类,python,k-means,tfidfvectorizer,Python,K Means,Tfidfvectorizer,我的主要目标是从语料库中计算关键字的tf-idf值,并对我在语料库中应用sklearn tf-idf矢量器后得到的矩阵进行k均值聚类。 下面是我如何计算tf idf的 结果,我得到了这个矩阵。 matrix.shape=(11318187) 现在我想在tf idf矩阵上执行肘部方法,以获得我的数据集所需的最佳集群数量,但我不确定如何实现。 这就是我到目前为止为肘部方法实现的。 我想找到聚类的数量,然后执行k-means聚类。我的最终目标是对这篇大文章进行一个句子聚类,从每个句子聚类中找出前10个

我的主要目标是从语料库中计算关键字的tf-idf值,并对我在语料库中应用sklearn tf-idf矢量器后得到的矩阵进行k均值聚类。 下面是我如何计算tf idf的 结果,我得到了这个矩阵。 matrix.shape=(11318187)

现在我想在tf idf矩阵上执行肘部方法,以获得我的数据集所需的最佳集群数量,但我不确定如何实现。 这就是我到目前为止为肘部方法实现的。 我想找到聚类的数量,然后执行k-means聚类。我的最终目标是对这篇大文章进行一个句子聚类,从每个句子聚类中找出前10个关键词。 例如 第一组:第1、6、7句。。等等 十大关键词: 第二组:第70句,第80句,第4句。。。等等 十大关键词: . . . k组:第75句,第67句,。。。。。还有儿子 十大关键词:

您能告诉我需要更改什么来计算数据集的群集数吗?