Nlp 斯坦福词性标记器不能在预先标记的文本中标记括号和引号

Nlp 斯坦福词性标记器不能在预先标记的文本中标记括号和引号,nlp,stanford-nlp,pos-tagger,part-of-speech,Nlp,Stanford Nlp,Pos Tagger,Part Of Speech,我有一个预先标记的文本作为斯坦福词性标记器的输入。它根本无法正确标记括号和引号。我不想要Stanford Tagger的默认标记化,所以我使用-tokenize false选项禁用了它 我知道我们应该转义字符,就像Penn Treebank在标记化过程中所做的那样,例如将括号变成-LRB-和-RRB-,这在中是受支持的 在斯坦福词性标记器中有没有一种方法可以很好地处理这个问题?请把你的代码、输入示例、你得到的输出和你想要得到的输出放在这里好吗?

我有一个预先标记的文本作为斯坦福词性标记器的输入。它根本无法正确标记括号和引号。我不想要Stanford Tagger的默认标记化,所以我使用
-tokenize false
选项禁用了它

我知道我们应该
转义字符
,就像
Penn Treebank
在标记化过程中所做的那样,例如将括号变成
-LRB-
-RRB-
,这在中是受支持的


在斯坦福词性标记器中有没有一种方法可以很好地处理这个问题?

请把你的代码、输入示例、你得到的输出和你想要得到的输出放在这里好吗?