Java，Stanford NLP：从解析器中提取特定的语音标签_Java_Parsing_Nlp_Stanford Nlp

Java，Stanford NLP：从解析器中提取特定的语音标签

java parsing nlp stanford-nlp

Java，Stanford NLP：从解析器中提取特定的语音标签,java,parsing,nlp,stanford-nlp,Java,Parsing,Nlp,Stanford Nlp,我最近发现了斯坦福NLP解析器，它看起来非常神奇。我目前有一个在我们项目中运行的it工作实例，但面临以下两个问题如何解析文本，然后仅从解析的数据中提取特定的语音标签，例如，如何仅从句子中提取NNPS和PRP 我们的平台使用英语和德语，因此文本可能是英语或德语。我如何适应这种情况。多谢各位代码： private final String PCG_MODEL = "edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz"; priva

我最近发现了斯坦福NLP解析器，它看起来非常神奇。我目前有一个在我们项目中运行的it工作实例，但面临以下两个问题

如何解析文本，然后仅从解析的数据中提取特定的语音标签，例如，如何仅从句子中提取

NNPS

和

PRP

我们的平台使用英语和德语，因此文本可能是英语或德语。我如何适应这种情况。多谢各位

代码：

 private final String PCG_MODEL = "edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz";

    private final TokenizerFactory<CoreLabel> tokenizerFactory = PTBTokenizer.factory(new CoreLabelTokenFactory(), "invertible=true");

 public void testParser() {
  LexicalizedParser lp = LexicalizedParser.loadModel(PCG_MODEL);
        String sent="Complete Howto guide to install EC2 Linux server in Amazon Web services cloud.";
        Tree parse;
        parse = lp.parse(sent);

        List taggedWords = parse.taggedYield();
        System.out.println(taggedWords);
}

private final String PCG_MODEL=“edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz”；
私有最终TokenizerFactory TokenizerFactory=PTBTokenizer.factory（新的CoreLabelTokenFactory（），“inversible=true”）；
公共void testParser（）{
LexicalizedParser lp=LexicalizedParser.loadModel（PCG_模型）；
String sent=“完成如何在Amazon Web services云中安装EC2 Linux服务器的指南。”；
树解析；
parse=lp.parse（已发送）；
List taggedWords=parse.taggedYield（）；
System.out.println（taggedWords）；
}

上面的例子是有效的，但正如您所看到的，我正在加载英文数据。多谢各位

对于查询1，我认为斯坦福nlp没有提取特定POS标签的选项

然而，使用定制的训练模型，我们可以实现同样的效果。我曾尝试过对NER名称实体识别自定义模型的类似要求。

尝试以下方法：

    for (Tree subTree: parse) // traversing the sentence's parse tree 
    {
      if(subTree.label().value().equals("NNPS")) //If the word's label is NNPS
       { //Do what you want }
    }

请参阅此处-@SrikanthA：谢谢，从第24点开始，我了解到，如果语言错误，会有回退机制。对第一个问题有什么想法吗。谢谢，谢谢。我对Query-2的看法是正确的，在那里它将返回到德语，还是我必须首先进行语言检测？对于Query-2，您可能必须查看这个-和。注意-我没有尝试多语言，但看看上面的链接是否有帮助