Stanford nlp 斯坦福POS标记器的数据格式

Stanford nlp 斯坦福POS标记器的数据格式,stanford-nlp,dataformat,Stanford Nlp,Dataformat,我正在根据自己的数据重新训练斯坦福POS标记器。我已经用以下每行一个标记的格式对同一数据的另外两名标记员进行了培训: word1_TAG word2_TAG word3_TAG word4_TAG . 这种格式适合Stanford tagger,还是每行需要一句话 word1_TAG word2_TAG word3_TAG word4_TAG . 使用第一种格式进行培训和测试会影响斯坦福大学的标记结果吗?每行应该有一句话(第二个示例) 使用第一种格式肯定会影响标记结果:您将有效地构建一个un

我正在根据自己的数据重新训练斯坦福POS标记器。我已经用以下每行一个标记的格式对同一数据的另外两名标记员进行了培训:

word1_TAG
word2_TAG
word3_TAG
word4_TAG
.
这种格式适合Stanford tagger,还是每行需要一句话

word1_TAG word2_TAG word3_TAG word4_TAG .

使用第一种格式进行培训和测试会影响斯坦福大学的标记结果吗?

每行应该有一句话(第二个示例)


使用第一种格式肯定会影响标记结果:您将有效地构建一个unigram标记器,其中所有标记都是在没有任何句子上下文的情况下完成的。

谢谢Jon。这是有道理的。嗨,特蕾莎,如果这解决了你的问题,请用左边的绿色复选标记将答案标记为“已接受”。谢谢