Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/vim/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 3.x 运行LDA模型时删除形容词和标记_Python 3.x_Lda_Topic Modeling - Fatal编程技术网

Python 3.x 运行LDA模型时删除形容词和标记

Python 3.x 运行LDA模型时删除形容词和标记,python-3.x,lda,topic-modeling,Python 3.x,Lda,Topic Modeling,我正在使用LDA模型对酒店评论数据集进行主题建模。 我已经做了大部分预处理步骤来删除不必要的单词,并使用参数进行了优化,这些参数可以过滤掉出现在文档数量少于一定数量且超过总语料库大小80%的标记。在将令牌转换为向量时,我也应用了tf idf。 即使我已经完成了这些步骤,我仍然会在主题中看到一些形容词作为关键词。 例如,我看到“惊人”、“伟大”、“美好”、“绝对”等等。 当然,这些词在关键词中并不占主导地位,也不是最重要的关键词(如顶级关键词)。但这些都会在多个主题中反复显示为关键字 我的问题是,

我正在使用LDA模型对酒店评论数据集进行主题建模。
我已经做了大部分预处理步骤来删除不必要的单词,并使用参数进行了优化,这些参数可以过滤掉出现在文档数量少于一定数量且超过总语料库大小80%的标记。在将令牌转换为向量时,我也应用了tf idf。

即使我已经完成了这些步骤,我仍然会在主题中看到一些形容词作为关键词。
例如,我看到“惊人”、“伟大”、“美好”、“绝对”等等。
当然,这些词在关键词中并不占主导地位,也不是最重要的关键词(如顶级关键词)。但这些都会在多个主题中反复显示为关键字
我的问题是,从非专家的角度来看,在运行LDA模型之前,有没有办法删除这些形容词表达式?
如果我事先删除了这些内容,并且故意不在主题建模分析中包含这些内容,那么这样做对吗?换句话说,因为我对分析任何情绪都不感兴趣,而是想关注主题及其对应的关键字,所以在运行主题建模时删除形容词是否有意义