Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/331.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 如何使用stanford依赖项解析器从文本中提取方面术语?_Java_Nlp_Stanford Nlp_Sentiment Analysis_Dependency Parsing - Fatal编程技术网

Java 如何使用stanford依赖项解析器从文本中提取方面术语?

Java 如何使用stanford依赖项解析器从文本中提取方面术语?,java,nlp,stanford-nlp,sentiment-analysis,dependency-parsing,Java,Nlp,Stanford Nlp,Sentiment Analysis,Dependency Parsing,我目前正在使用在线旅游评论进行方面层面的情绪分析项目 我正在使用stanfordcorenlp来完成事情。到目前为止,我已经通过词性标注和对评论内容进行分类来对数据进行预处理 我读了几篇与情绪分析相关的论文,看起来下一步是从评论文本中提取方面术语,我看过一个Python NLTK的视频教程,其中使用正则表达式查找词性标记词之间的关系,查找名词短语等。我想使用Stanford Dependency parser做同样的事情 不幸的是,我不明白如何使用Stanford Dependency Pars

我目前正在使用在线旅游评论进行方面层面的情绪分析项目

我正在使用
stanfordcorenlp
来完成事情。到目前为止,我已经通过词性标注和对评论内容进行分类来对数据进行预处理

我读了几篇与情绪分析相关的论文,看起来下一步是从评论文本中提取方面术语,我看过一个Python NLTK的视频教程,其中使用正则表达式查找词性标记词之间的关系,查找名词短语等。我想使用Stanford Dependency parser做同样的事情

不幸的是,我不明白如何使用Stanford Dependency Parser的输出来编写这样的规则来识别方面术语

两天来,我一直在寻找一个示例Java代码,该代码将解释我如何准确地完成这项任务。但到目前为止,运气不好

如果有人能给我提供一个教程/示例代码,让我看看并理解这个过程,我将不胜感激

假设我有一个类似于下面的输出

(ROOT
  (S
    (NP (PRP It))
    (VP (VBZ is) (RB not)
      (NP
        (NP (DT a) (NN museum))
        (PP (CC but)
          (NP
            (NP (DT a) (VBG living) (JJ historic) (NN town))
            (PP (IN with)
              (NP (JJ wonderful) (NNS places)))
            (S
              (VP (TO to)
                (VP
                  (VP (VB eat)
                    (NP (NN drink)))
                  (CC and)
                  (VP (VB do)
                    (NP (NN shopping))))))))))
如何提取博物馆购物作为方面


非常感谢您的帮助。

我想您已经查看了有关解析器本身的文档了吧?您可以提供选项-outputFormat typedDependencies或-outputFormat typedDependenciesCollapsed以获得类型依赖项(或语法关系)输出(目前仅适用于英文和中文)。您可以使用-outputFormatOptions词汇化选项打印出词汇化树(每个短语节点的标题词和标记)。您可以通过查看TreePrint类的Javadoc来查看所有其他选项。此外,看起来曼宁自己已经回答了类似的问题stackoverflow.com/questions/11832490Or