Java OpenNLP NameFinder自定义功能生成

Java OpenNLP NameFinder自定义功能生成,java,machine-learning,opennlp,named-entity-recognition,Java,Machine Learning,Opennlp,Named Entity Recognition,我想训练自己的模型在OpenNLP NameFinder中使用 搜索了很多,最后找到了一个工作代码来训练模型,但并不准确。文件还说,你需要15000个句子才能得到一个准确的模型 因此,你需要有15000个句子,每一次都有一个好的上下文和名称。要做到这一点,你必须花费数小时 天/月写.txt文件。 我做了一些进一步的搜索来训练一个模型,而不需要自己编写所有的代码,然后开始了OpenNLP的自定义特性生成。 但它并没有说明如何使用它。文件给出了以下内容: AdaptiveFeatureGenera

我想训练自己的模型在
OpenNLP NameFinder
中使用

搜索了很多,最后找到了一个工作代码来训练模型,但并不准确。文件还说,你需要15000个句子才能得到一个准确的模型

因此,你需要有15000个句子,每一次都有一个好的上下文和名称
。要做到这一点,你必须花费数小时 天/月写
.txt文件。

我做了一些进一步的搜索来训练一个模型,而不需要自己编写所有的代码,然后开始了OpenNLP的自定义特性生成。

但它并没有说明如何使用它。文件给出了以下内容:

AdaptiveFeatureGenerator featureGenerator = new CachedFeatureGenerator(
     new AdaptiveFeatureGenerator[]{
       new WindowFeatureGenerator(new TokenFeatureGenerator(), 2, 2),
       new WindowFeatureGenerator(new TokenClassFeatureGenerator(true), 2, 2),
       new OutcomePriorFeatureGenerator(),
       new PreviousMapFeatureGenerator(),
       new BigramNameFeatureGenerator(),
       new SentenceFeatureGenerator(true, false)
       });
有人知道怎么用这个吗?或者更好的是,是否有人已经成功地为
OpenNLP-NER
训练了自己的模型,而没有在数据集中键入自己的名字


提前感谢。

您仍然需要带注释的培训文本。在培训期间使用特征生成器创建更好的模型。不幸的是,没有什么可以替代带注释的培训文本。

你知道如何在不键入15000句内容良好的句子的情况下获得带注释的文本吗?如何收集培训取决于你的领域。您希望处理哪种自然语言文本?这有助于您理解收集和注释过程应该如何工作。如果需要创建自定义NER模型,可以帮助您创建模型。目前,我们正在进行注释NEs的工作,应该在未来几周内完成。感谢您提供的信息,我对您项目的结果感兴趣。@Patrick,我发布了我项目的测试版。是否要测试该项目以培训您的自定义NER模型?我很高兴给你一些建议。我们可以安排一次聊天,这样我就可以向您演示该框架了。;-)