Java,Stanford NLP:从解析器中提取特定的语音标签
我最近发现了斯坦福NLP解析器,它看起来非常神奇。我目前有一个在我们项目中运行的it工作实例,但面临以下两个问题Java,Stanford NLP:从解析器中提取特定的语音标签,java,parsing,nlp,stanford-nlp,Java,Parsing,Nlp,Stanford Nlp,我最近发现了斯坦福NLP解析器,它看起来非常神奇。我目前有一个在我们项目中运行的it工作实例,但面临以下两个问题 如何解析文本,然后仅从解析的数据中提取特定的语音标签,例如,如何仅从句子中提取NNPS和PRP 我们的平台使用英语和德语,因此文本可能是英语或德语。我如何适应这种情况。多谢各位 代码: private final String PCG_MODEL = "edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz"; priva
NNPS
和PRP
李>
private final String PCG_MODEL = "edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz";
private final TokenizerFactory<CoreLabel> tokenizerFactory = PTBTokenizer.factory(new CoreLabelTokenFactory(), "invertible=true");
public void testParser() {
LexicalizedParser lp = LexicalizedParser.loadModel(PCG_MODEL);
String sent="Complete Howto guide to install EC2 Linux server in Amazon Web services cloud.";
Tree parse;
parse = lp.parse(sent);
List taggedWords = parse.taggedYield();
System.out.println(taggedWords);
}
private final String PCG_MODEL=“edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz”;
私有最终TokenizerFactory TokenizerFactory=PTBTokenizer.factory(新的CoreLabelTokenFactory(),“inversible=true”);
公共void testParser(){
LexicalizedParser lp=LexicalizedParser.loadModel(PCG_模型);
String sent=“完成如何在Amazon Web services云中安装EC2 Linux服务器的指南。”;
树解析;
parse=lp.parse(已发送);
List taggedWords=parse.taggedYield();
System.out.println(taggedWords);
}
上面的例子是有效的,但正如您所看到的,我正在加载英文数据。多谢各位 对于查询1,我认为斯坦福nlp没有提取特定POS标签的选项 然而,使用定制的训练模型,我们可以实现同样的效果。我曾尝试过对NER名称实体识别自定义模型的类似要求。尝试以下方法:
for (Tree subTree: parse) // traversing the sentence's parse tree
{
if(subTree.label().value().equals("NNPS")) //If the word's label is NNPS
{ //Do what you want }
}
请参阅此处-@SrikanthA:谢谢,从第24点开始,我了解到,如果语言错误,会有回退机制。对第一个问题有什么想法吗。谢谢,谢谢。我对Query-2的看法是正确的,在那里它将返回到德语,还是我必须首先进行语言检测?对于Query-2,您可能必须查看这个-和。注意-我没有尝试多语言,但看看上面的链接是否有帮助