Stanford nlp 孤立地(在句子之外)在标记上标记阴蒂词

Stanford nlp 孤立地(在句子之外)在标记上标记阴蒂词,stanford-nlp,Stanford Nlp,在英语中,当我在没有其他上下文的情况下标记文本(如“that'll”)时,我会得到以下标记: 那 " ll 但是,当我标记文本(例如“那将是所有人”)时,我会得到以下标记(这是我对“'ll”的预期结果): 那 “好的 是 全部 乡亲们 我有以下一套: tokenize.languae=英语 tokenize.whitespace=false tokenize.keepeol=false tokenize.verbose=false tokenize.options=inversibl

在英语中,当我在没有其他上下文的情况下标记文本(如“that'll”)时,我会得到以下标记:

  • "
  • ll
但是,当我标记文本(例如“那将是所有人”)时,我会得到以下标记(这是我对“'ll”的预期结果):

  • “好的
  • 全部
  • 乡亲们
我有以下一套:

  • tokenize.languae=英语
  • tokenize.whitespace=false
  • tokenize.keepeol=false
  • tokenize.verbose=false
  • tokenize.options=inversible=true、splitassemptions=true、splitHyphenated=false、splitForwardSlash=true、unnotkenizable=firstDelete、strictreebank3=true、normalizeSpace=false
有没有一种方法可以让StanfordCorenlp在没有其他上下文的情况下正确标记单个缩略词?我在这里看不到任何其他选项:

“想”、“要”、“应该”等词也会发生同样的情况。它们在单独使用时不会被标记化