Stanford nlp nltk stanford ner tagger和stanford ner tagger在线演示之间的不一致
我正在使用python的内置库nltk来获得stanford ner tagger api设置,但我发现此api对单词的标记与stanford的ner tagger网站上的在线演示不一致。一些单词在在线演示中被标记,而它们在python中不在api中,类似地,一些单词被标记的方式不同。我使用了与网站中提到的分类相同。有人能告诉我为什么会出现这个问题以及解决方案是什么吗?我遇到了同样的问题,并确定我的代码和在线演示对文本应用了不同的格式规则Stanford nlp nltk stanford ner tagger和stanford ner tagger在线演示之间的不一致,stanford-nlp,Stanford Nlp,我正在使用python的内置库nltk来获得stanford ner tagger api设置,但我发现此api对单词的标记与stanford的ner tagger网站上的在线演示不一致。一些单词在在线演示中被标记,而它们在python中不在api中,类似地,一些单词被标记的方式不同。我使用了与网站中提到的分类相同。有人能告诉我为什么会出现这个问题以及解决方案是什么吗?我遇到了同样的问题,并确定我的代码和在线演示对文本应用了不同的格式规则 您使用的是什么版本的CoreNLP?我们偶尔会在发布之
您使用的是什么版本的CoreNLP?我们偶尔会在发布之间更新模型。除此之外,机器之间偶尔会有突破性的差异。我发现了和萨萨克一样的东西。特别是,我注意到,在我使用的版本(3.7.0,从2017年2月28日下载)中,姓名前的标题(如Jones先生中的“Mr.”未标记为实体的一部分,但在在线演示中标记了该标题。我希望标题被标记。有可能在Github或其他地方获得中间版本吗?(我使用的是7级模型)。
for s in ('\f', '\n', '\r', '\t', '\v'): #strip whitespaces
text = text.replace(s, '')
text += '\n' #ensure end-of-line