Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/308.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 基于sklearn或gensim的有监督维度redunction/topic模型_Python_Machine Learning_Gensim_Dimensionality Reduction - Fatal编程技术网

Python 基于sklearn或gensim的有监督维度redunction/topic模型

Python 基于sklearn或gensim的有监督维度redunction/topic模型,python,machine-learning,gensim,dimensionality-reduction,Python,Machine Learning,Gensim,Dimensionality Reduction,我有弓形向量,我想知道sklearn或gensim中是否有监督降维算法,能够获取高维、监督数据,并将其投影到低维空间,从而保持这些类之间的差异 事实上,我正试图为分类/回归找到一个合适的度量,我相信使用维度可以帮助我。我知道有无监督的方法,但我希望保留标签信息。您只能以无监督的方式或有监督的方式执行降维,但标签与目标标签不同 例如,您可以使用包含100个主题的数据集来训练逻辑回归分类器。使用您的训练数据,该分类器的100个值的输出可能是您的降维功能集。-Facebook research的实现,

我有弓形向量,我想知道sklearn或gensim中是否有监督降维算法,能够获取高维、监督数据,并将其投影到低维空间,从而保持这些类之间的差异


事实上,我正试图为分类/回归找到一个合适的度量,我相信使用维度可以帮助我。我知道有无监督的方法,但我希望保留标签信息。

您只能以无监督的方式或有监督的方式执行降维,但标签与目标标签不同

例如,您可以使用包含100个主题的数据集来训练逻辑回归分类器。使用您的训练数据,该分类器的100个值的输出可能是您的降维功能集。

-Facebook research的实现,基本上帮助您实现您一直要求的功能。既然您询问了gensim,我想您可能知道gensim中的word2vec


现在word2vec是米科洛夫在谷歌工作时提出的。Mikolov和他的Facebook ahs团队提出了fastText,它考虑了单词和子单词信息。它还允许对文本进行分类。

这样的方法不会产生预期的结果,因为您正在学习对已经减少的集合的管理