Python 导出具有独立含义的ngrams，以提供给可视化部分_Python_Nlp_N Gram_Part Of Speech

Python 导出具有独立含义的ngrams，以提供给可视化部分

python nlp

Python 导出具有独立含义的ngrams，以提供给可视化部分,python,nlp,n-gram,part-of-speech,Python,Nlp,N Gram,Part Of Speech,通过一些客户评论，我在语料库中得出了重要的主题[成本、副作用、生效时间]。现在，对于每个主题，我想用以下方式进行情绪分析：推导出n个与主题相关的独立意义的语法。例如，如您所见，图片中有3个主题。在“生效时间”这一主题中，“一段时间”或“不立即”等短语是相关的我在Python中所做的：对于每个主题，我手动将语料库划分为两个层次用和主题相关的词造句没有与主题相关单词的句子然后，我计算了每个单词的过度索引，希望我们想要在句子中过度索引的单词。（例如，[“它”，0.001][“是”，0.00

通过一些客户评论，我在语料库中得出了重要的主题[成本、副作用、生效时间]。现在，对于每个主题，我想用以下方式进行情绪分析：推导出n个与主题相关的独立意义的语法。例如，如您所见，图片中有3个主题。在“生效时间”这一主题中，“一段时间”或“不立即”等短语是相关的

我在Python中所做的：对于每个主题，我手动将语料库划分为两个层次

用和主题相关的词造句

没有与主题相关单词的句子

然后，我计算了每个单词的过度索引，希望我们想要在句子中过度索引的单词。（例如，[“它”，0.001][“是”，0.001]，“不是”，0.002]，“立即的”，0.042]，“但是”，0.002]，“它”，0.001]，“做”，0.002]，“工作”，0.002]）但这不起作用，因为其他一些与主题无关的词有很高的索引过度值

有没有其他方法可以导出与主题相关的n-gram？我的最终目标是制作如下内容：

它似乎类似于搭配（），只是你要找的是ngram而不是一般的bigrams。也许可以尝试修改该页面上的方法，在该页面中查找出现频率高于偶然性的序列。它似乎类似于搭配（），但您要查找的是ngram而不是一般的bigram。也许可以尝试修改该页面上的方法，在该页面中，您查找的序列比偶然出现的序列更频繁