Stanford nlp nltk stanford ner tagger和stanford ner tagger在线演示之间的不一致_Stanford Nlp

Stanford nlp nltk stanford ner tagger和stanford ner tagger在线演示之间的不一致

stanford-nlp

Stanford nlp nltk stanford ner tagger和stanford ner tagger在线演示之间的不一致,stanford-nlp,Stanford Nlp,我正在使用python的内置库nltk来获得stanford ner tagger api设置，但我发现此api对单词的标记与stanford的ner tagger网站上的在线演示不一致。一些单词在在线演示中被标记，而它们在python中不在api中，类似地，一些单词被标记的方式不同。我使用了与网站中提到的分类相同。有人能告诉我为什么会出现这个问题以及解决方案是什么吗？我遇到了同样的问题，并确定我的代码和在线演示对文本应用了不同的格式规则您使用的是什么版本的CoreNLP？我们偶尔会在发布之

我正在使用python的内置库nltk来获得stanford ner tagger api设置，但我发现此api对单词的标记与stanford的ner tagger网站上的在线演示不一致。一些单词在在线演示中被标记，而它们在python中不在api中，类似地，一些单词被标记的方式不同。我使用了与网站中提到的分类相同。有人能告诉我为什么会出现这个问题以及解决方案是什么吗？

我遇到了同样的问题，并确定我的代码和在线演示对文本应用了不同的格式规则

您使用的是什么版本的CoreNLP？我们偶尔会在发布之间更新模型。除此之外，机器之间偶尔会有突破性的差异。我发现了和萨萨克一样的东西。特别是，我注意到，在我使用的版本（3.7.0，从2017年2月28日下载）中，姓名前的标题（如Jones先生中的“Mr.”未标记为实体的一部分，但在在线演示中标记了该标题。我希望标题被标记。有可能在Github或其他地方获得中间版本吗？（我使用的是7级模型）。

for s in ('\f', '\n', '\r', '\t', '\v'): #strip whitespaces
            text = text.replace(s, '')
        text += '\n' #ensure end-of-line