Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/342.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 在eclipse中重新训练stanford nlp pos标记器_Java_Eclipse_Nlp_Pos Tagger - Fatal编程技术网

Java 在eclipse中重新训练stanford nlp pos标记器

Java 在eclipse中重新训练stanford nlp pos标记器,java,eclipse,nlp,pos-tagger,Java,Eclipse,Nlp,Pos Tagger,我是nlp的新手,我正在尝试找出pos标签。 目前我正在试用斯坦福nlp pos标签,url: 从上面的链接中,有这样一句话: 标记者可以在任何语言上重新训练,只要有POS注释 该语言的培训文本 然而,我无法让它工作。我现在所能做的就是给它一个文本文件来标记。例如,String test=“这是一个测试”将返回我这个是测试 我怎样才能开始重新培训标签工?假设我希望返回上面的字符串,因为它是测试 感谢您的回答。除非您有一个POS标记语料库,其中包含许多您希望纠正的现象/现象的示例,否则您很可能无法

我是nlp的新手,我正在尝试找出pos标签。 目前我正在试用斯坦福nlp pos标签,url:

从上面的链接中,有这样一句话:

标记者可以在任何语言上重新训练,只要有POS注释 该语言的培训文本

然而,我无法让它工作。我现在所能做的就是给它一个文本文件来标记。例如,
String test=“这是一个测试”将返回我这个是测试

我怎样才能开始重新培训标签工?假设我希望返回上面的字符串,因为它是测试


感谢您的回答。

除非您有一个POS标记语料库,其中包含许多您希望纠正的现象/现象的示例,否则您很可能无法成功地重新培训标记者模型。要澄清的是,基于我对斯坦福工具如何进行培训的期望,没有任何机制可以添加单个示例来修改模型。你需要有一个完整的语料库并重新培训

如果您确实有一个语料库,那么我将参考此文档以获得有关文件格式的详细信息以及培训斯坦福CoreNLP模型的正确步骤

否则,最好编写一些覆盖行为的后处理规则/正则表达式模式。这些规则的一个用途是确保单词列表中的人和地点被标记为专有名词(NNP)


祝你好运

在上面的例子中,“test”是一个名词,它是正确的标记。你的意思是训练区分名词和动词吗?嗨,哈克特,谢谢你的回答。不,我不是要区分名词和动词。简单地说,如果输出标签不是我想要的,我如何重新训练标签工?