Model 用DB数据在OpenNLP中训练自己的模型
我在数据库中有数据,需要用这些数据训练自己的模型。所有人都建议尝试以下代码 但是我是否可以在不使用sampleStream(不使用文件直接数据)的情况下创建模型?我是openNLP的新手Model 用DB数据在OpenNLP中训练自己的模型,model,training-data,opennlp,Model,Training Data,Opennlp,我在数据库中有数据,需要用这些数据训练自己的模型。所有人都建议尝试以下代码 但是我是否可以在不使用sampleStream(不使用文件直接数据)的情况下创建模型?我是openNLP的新手 public void trainModel() { DoccatModel model = null; InputStream dataIn = null; try{ InputStreamFactory factory = getInputStreamFactory(
public void trainModel() {
DoccatModel model = null;
InputStream dataIn = null;
try{
InputStreamFactory factory = getInputStreamFactory(new File("D:/training.txt"));
ObjectStream<String> lineStream = new PlainTextByLineStream(factory, Charset.defaultCharset());
ObjectStream<DocumentSample> sampleStream = new DocumentSampleStream(lineStream);
TrainingParameters params = new TrainingParameters();
params.put(TrainingParameters.ITERATIONS_PARAM, "100");
params.put(TrainingParameters.CUTOFF_PARAM, "0");
model = DocumentCategorizerME.train("en", sampleStream, params, factory);
}catch(Exception e){
e.printStackTrace();
}
}
public void trainModel(){
DoccatModel model=null;
InputStream数据输入=null;
试一试{
InputStreamFactory=getInputStreamFactory(新文件(“D:/training.txt”);
ObjectStream lineStream=新的明文bylinestream(工厂,Charset.defaultCharset());
ObjectStream sampleStream=新文档sampleStream(lineStream);
TrainingParameters params=新的TrainingParameters();
参数put(TrainingParameters.ITERATIONS_PARAM,“100”);
参数put(训练参数截断参数,“0”);
模型=DocumentCategorizerME.train(“en”、sampleStream、params、factory);
}捕获(例外e){
e、 printStackTrace();
}
}