Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/299.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 导出具有独立含义的ngrams,以提供给可视化部分_Python_Nlp_N Gram_Part Of Speech - Fatal编程技术网

Python 导出具有独立含义的ngrams,以提供给可视化部分

Python 导出具有独立含义的ngrams,以提供给可视化部分,python,nlp,n-gram,part-of-speech,Python,Nlp,N Gram,Part Of Speech,通过一些客户评论,我在语料库中得出了重要的主题[成本、副作用、生效时间]。 现在,对于每个主题,我想用以下方式进行情绪分析: 推导出n个与主题相关的独立意义的语法。例如,如您所见,图片中有3个主题。在“生效时间”这一主题中,“一段时间”或“不立即”等短语是相关的 我在Python中所做的:对于每个主题,我手动将语料库划分为两个层次 用和主题相关的词造句 没有与主题相关单词的句子 然后,我计算了每个单词的过度索引,希望我们想要在句子中过度索引的单词。(例如,[“它”,0.001][“是”,0.00

通过一些客户评论,我在语料库中得出了重要的主题[成本、副作用、生效时间]。 现在,对于每个主题,我想用以下方式进行情绪分析: 推导出n个与主题相关的独立意义的语法。例如,如您所见,图片中有3个主题。在“生效时间”这一主题中,“一段时间”或“不立即”等短语是相关的

我在Python中所做的:对于每个主题,我手动将语料库划分为两个层次

  • 用和主题相关的词造句
  • 没有与主题相关单词的句子
  • 然后,我计算了每个单词的过度索引,希望我们想要在句子中过度索引的单词。(例如,[“它”,0.001][“是”,0.001],“不是”,0.002],“立即的”,0.042],“但是”,0.002],“它”,0.001],“做”,0.002],“工作”,0.002]) 但这不起作用,因为其他一些与主题无关的词有很高的索引过度值

    有没有其他方法可以导出与主题相关的n-gram? 我的最终目标是制作如下内容:


    它似乎类似于搭配(),只是你要找的是ngram而不是一般的bigrams。也许可以尝试修改该页面上的方法,在该页面中查找出现频率高于偶然性的序列。它似乎类似于搭配(),但您要查找的是ngram而不是一般的bigram。也许可以尝试修改该页面上的方法,在该页面中,您查找的序列比偶然出现的序列更频繁