Python 导出具有独立含义的ngrams,以提供给可视化部分
通过一些客户评论,我在语料库中得出了重要的主题[成本、副作用、生效时间]。 现在,对于每个主题,我想用以下方式进行情绪分析: 推导出n个与主题相关的独立意义的语法。例如,如您所见,图片中有3个主题。在“生效时间”这一主题中,“一段时间”或“不立即”等短语是相关的 我在Python中所做的:对于每个主题,我手动将语料库划分为两个层次Python 导出具有独立含义的ngrams,以提供给可视化部分,python,nlp,n-gram,part-of-speech,Python,Nlp,N Gram,Part Of Speech,通过一些客户评论,我在语料库中得出了重要的主题[成本、副作用、生效时间]。 现在,对于每个主题,我想用以下方式进行情绪分析: 推导出n个与主题相关的独立意义的语法。例如,如您所见,图片中有3个主题。在“生效时间”这一主题中,“一段时间”或“不立即”等短语是相关的 我在Python中所做的:对于每个主题,我手动将语料库划分为两个层次 用和主题相关的词造句 没有与主题相关单词的句子 然后,我计算了每个单词的过度索引,希望我们想要在句子中过度索引的单词。(例如,[“它”,0.001][“是”,0.00
它似乎类似于搭配(),只是你要找的是ngram而不是一般的bigrams。也许可以尝试修改该页面上的方法,在该页面中查找出现频率高于偶然性的序列。它似乎类似于搭配(),但您要查找的是ngram而不是一般的bigram。也许可以尝试修改该页面上的方法,在该页面中,您查找的序列比偶然出现的序列更频繁