Nlp 从标记器获取附加信息(主动/被动、时态…)

Nlp 从标记器获取附加信息(主动/被动、时态…),nlp,stanford-nlp,pos-tagger,Nlp,Stanford Nlp,Pos Tagger,我用斯坦福标记器来确定词类。然而,我想从文本中获得更多信息。是否有可能获得进一步的信息,比如句子的时态,或者是主动/被动语态 到目前为止,我使用的是非常基本的词性标注方法: List<List<TaggedWord>> taggedUnits = new ArrayList<List<TaggedWord>>(); String input = "This sentence is going to be future. The door was

我用斯坦福标记器来确定词类。然而,我想从文本中获得更多信息。是否有可能获得进一步的信息,比如句子的时态,或者是主动/被动语态

到目前为止,我使用的是非常基本的词性标注方法:

List<List<TaggedWord>> taggedUnits = new ArrayList<List<TaggedWord>>();

String input = "This sentence is going to be future. The door was opened.";
for (List<HasWord> sentence : MaxentTagger.tokenizeText(new StringReader(input)))
{
     taggedUnits.add(tagger.tagSentence(sentence));
}
List taggedUnits=new ArrayList();
String input=“这句话将成为未来。门已经打开。”;
for(列表语句:MaxentTagger.tokenizeText(新StringReader(输入)))
{
taggedUnits.add(tagger.tag句子(句子));
}

您可以从各种penn标签中获取时态信息:

27. VB  Verb, base form
28. VBD Verb, past tense
29. VBG Verb, gerund or present participle
30. VBN Verb, past participle
31. VBP Verb, non-3rd person singular present
32. VBZ Verb, 3rd person singular present
关于主动/被动方面,您可以使用斯坦福核心NLP中包含的类型依赖项

  • 如果句子是主动语态,则应存在“nsubj”依赖关系
  • 如果句子是被动语态,“nsubjpass”依赖项应为 存在

  • 希望这有帮助。

    非常感谢您的帮助!然而,我在使用德语进行“主动/被动检测”时遇到了问题->我一直在阅读关于这方面的文档,这种nsubjpass关系似乎是所有被动句的一个特征-这非常有用,但不是全部,因为两者都可以出现。例如,“在营地建立之前,他们不再说话。”我得到nsubjpass表示“营地”,nsubj表示“他们”。假设句子中的前一个句子更重要是否合理?