Java StanfordNLP POS给出的结果好坏参半_Java_Stanford Nlp_Part Of Speech

Java StanfordNLP POS给出的结果好坏参半

java stanford-nlp

Java StanfordNLP POS给出的结果好坏参半,java,stanford-nlp,part-of-speech,Java,Stanford Nlp,Part Of Speech,我在测试斯坦福NLP POS Tagger，结果好坏参半 SOP(StanfordNLP.getInstance().getPOSMap("WHEAT flour(whole)".toLowerCase())); SOP(StanfordNLP.getInstance().getPOSMap("Whole wheat flour".toLowerCase())); 给我以下输出 {NN=[wheat, flour, whole]} {JJ=[whole], NN=[wheat, flour]}

我在测试斯坦福NLP POS Tagger，结果好坏参半

SOP(StanfordNLP.getInstance().getPOSMap("WHEAT flour(whole)".toLowerCase()));
SOP(StanfordNLP.getInstance().getPOSMap("Whole wheat flour".toLowerCase()));

给我以下输出

{NN=[wheat, flour, whole]}
{JJ=[whole], NN=[wheat, flour]}

我如何处理这样的问题？实际上是相同的词重新排列

编辑

也许，我应该解释一下这个问题

我想比较两个句子。我的方法是对两个字符串执行POS，然后比较并分别为两个字符串中的名词/形容词/动词打分

但由于基于单词顺序的模糊标记（也被@Elliott引用），我的排名在某些情况下失败。有人能提出解决办法吗

是否有一个分类统计数据可以给出一个名词被分类为形容词或动词等的概率，我可以在评分算法中使用它来提供权重

谢谢

Chahat

位置标记者总是给出不同的结果；词性标注是上下文的，因为一个词在不同的上下文中可以是名词、形容词或动词。词性标注的重要性决定了如何根据单词在句子中的顺序对其进行标注。

斯坦福词性标注器相当不错。但是，如果您想轻松查看与标准NLTK和其他名为Senna的质量标记器的并排比较，您可以尝试以下方法：

谢谢@Elliott，可能我之前对我的问题不清楚。请提供更多详细信息：关于Stackoverflow链接应用作参考，您的问题应自行回答。代码太多，无法粘贴。链接到的代码将允许OP使用MP线程比较不同的POS标记器，以比较任意范围文本输入的结果。