Java 使用BRAT为OpenNlp创建和训练模型?
我可能需要为OpenNLP创建一个自定义训练集,这将需要我手动注释许多条目 为了让事情变得更简单,GUI解决方案可能是最好的主意(手动编写注释标签,这并不酷),我刚刚发现了BRAT,它看起来正是我所需要的 BRAT可以导出带注释的文件(.ann),但我在中找不到对此文件类型的任何引用,我不确定这是否可行 我想做的是从BRAT导出这个带注释的文件,并使用它来训练OpenNLP的模型,我并不在乎是否可以使用代码或CLI来完成Java 使用BRAT为OpenNlp创建和训练模型?,java,opennlp,brat,Java,Opennlp,Brat,我可能需要为OpenNLP创建一个自定义训练集,这将需要我手动注释许多条目 为了让事情变得更简单,GUI解决方案可能是最好的主意(手动编写注释标签,这并不酷),我刚刚发现了BRAT,它看起来正是我所需要的 BRAT可以导出带注释的文件(.ann),但我在中找不到对此文件类型的任何引用,我不确定这是否可行 我想做的是从BRAT导出这个带注释的文件,并使用它来训练OpenNLP的模型,我并不在乎是否可以使用代码或CLI来完成 有人能给我指出正确的方向吗?OpenNLP对BRAT格式提供了本机支持,用
有人能给我指出正确的方向吗?OpenNLP对BRAT格式提供了本机支持,用于名称查找器的培训和评估。目前不支持其他组件。添加对其他组件的支持可能并不困难,如果您感兴趣,您应该在opennlp开发列表中请求它 CLI可用于使用brat训练模型,以下命令将显示其用法:
- bin/opennlp TokenNameFinderTrainer.brat
- bratDataDir这应该指向包含.ann和.txt文件的文件夹
- annotationConfig必须指向brat用于注释项目的配置文件
- 使用文本文档的语言(如英语)
- model创建的模型文件的名称
- bin/opennlp TokenNameFinderCrossValidator.brat
- bin/opennlp标记名finderevaluator.brat