Java,Stanford NLP:从解析器中提取特定的语音标签

Java,Stanford NLP:从解析器中提取特定的语音标签,java,parsing,nlp,stanford-nlp,Java,Parsing,Nlp,Stanford Nlp,我最近发现了斯坦福NLP解析器,它看起来非常神奇。我目前有一个在我们项目中运行的it工作实例,但面临以下两个问题 如何解析文本,然后仅从解析的数据中提取特定的语音标签,例如,如何仅从句子中提取NNPS和PRP 我们的平台使用英语和德语,因此文本可能是英语或德语。我如何适应这种情况。多谢各位 代码: private final String PCG_MODEL = "edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz"; priva

我最近发现了斯坦福NLP解析器,它看起来非常神奇。我目前有一个在我们项目中运行的it工作实例,但面临以下两个问题

  • 如何解析文本,然后仅从解析的数据中提取特定的语音标签,例如,如何仅从句子中提取
    NNPS
    PRP
  • 我们的平台使用英语和德语,因此文本可能是英语或德语。我如何适应这种情况。多谢各位
  • 代码:

     private final String PCG_MODEL = "edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz";
    
        private final TokenizerFactory<CoreLabel> tokenizerFactory = PTBTokenizer.factory(new CoreLabelTokenFactory(), "invertible=true");
    
     public void testParser() {
      LexicalizedParser lp = LexicalizedParser.loadModel(PCG_MODEL);
            String sent="Complete Howto guide to install EC2 Linux server in Amazon Web services cloud.";
            Tree parse;
            parse = lp.parse(sent);
    
            List taggedWords = parse.taggedYield();
            System.out.println(taggedWords);
    }
    
    private final String PCG_MODEL=“edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz”;
    私有最终TokenizerFactory TokenizerFactory=PTBTokenizer.factory(新的CoreLabelTokenFactory(),“inversible=true”);
    公共void testParser(){
    LexicalizedParser lp=LexicalizedParser.loadModel(PCG_模型);
    String sent=“完成如何在Amazon Web services云中安装EC2 Linux服务器的指南。”;
    树解析;
    parse=lp.parse(已发送);
    List taggedWords=parse.taggedYield();
    System.out.println(taggedWords);
    }
    

    上面的例子是有效的,但正如您所看到的,我正在加载英文数据。多谢各位

    对于查询1,我认为斯坦福nlp没有提取特定POS标签的选项

    然而,使用定制的训练模型,我们可以实现同样的效果。我曾尝试过对NER名称实体识别自定义模型的类似要求。

    尝试以下方法:

        for (Tree subTree: parse) // traversing the sentence's parse tree 
        {
          if(subTree.label().value().equals("NNPS")) //If the word's label is NNPS
           { //Do what you want }
        }
    

    请参阅此处-@SrikanthA:谢谢,从第24点开始,我了解到,如果语言错误,会有回退机制。对第一个问题有什么想法吗。谢谢,谢谢。我对Query-2的看法是正确的,在那里它将返回到德语,还是我必须首先进行语言检测?对于Query-2,您可能必须查看这个-和。注意-我没有尝试多语言,但看看上面的链接是否有帮助