Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/384.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 用OpenNLP训练大数据集_Java_Nlp_Opennlp - Fatal编程技术网

Java 用OpenNLP训练大数据集

Java 用OpenNLP训练大数据集,java,nlp,opennlp,Java,Nlp,Opennlp,我的数据集包含.train文件及其非常大的文件,比如100MB的文件。我想执行NER来提取组织名称。我使用OpenNLP进行训练 示例代码: TokenNameFinderModel model=NameFinderME.train("en","organization", sampleStream,Collections.<String, Object>emptyMap()); TokenNameFinderModel model=NameFinde

我的数据集包含
.train
文件及其非常大的文件,比如100MB的文件。我想执行NER来提取组织名称。我使用OpenNLP进行训练

示例代码:

TokenNameFinderModel model=NameFinderME.train("en","organization",
              sampleStream,Collections.<String, Object>emptyMap()); 
TokenNameFinderModel model=NameFinderME.train(“en”,“组织”,
sampleStream,Collections.emptyMap());
但我得到一个错误:
ArrayIndexOutofBoundException

有没有办法使用openNLP for NER来训练大型数据集?你能发布示例代码吗


当我在谷歌上搜索时,我发现类GIS和DataIndexer接口可以用来训练大型数据集,但我知道怎么做?您可以发布示例代码吗?

我可以创建包含更大数据的模型,而不会出现任何问题。您的.train文件中的标记可能有问题。另外,如果你能发布完整的异常,会有帮助吗


为了训练更大的模型,我只需校准截止值并增加Java内存。

是的,它工作了,实际上这是我的tarin文件中的问题,现在模型已经创建。谢谢你们花了多少时间来训练你们的模特?谢谢