Java 如何用OpenNLP实现阿尔巴尼亚语命名实体识别?

Java 如何用OpenNLP实现阿尔巴尼亚语命名实体识别?,java,nlp,opennlp,Java,Nlp,Opennlp,我正在试用阿尔巴尼亚语的OpenNLP。为此,我正在使用OPenNLP,并试图用阿尔巴尼亚语为个人、地点和组织实体识别建立模型。 我正在构建我自己的语料库,但我需要一位开放式NLP专家来确认我的以下疑问: 1-我是否应该为每个模型建立一个单独的语料库,例如,为ner人员建立一个只存在标签的语料库? 2-是否可以在同一语料库中标记人物、地点和组织,并使用它来训练一个能够提取所有三种实体类型的单一模型? 3-是否有资源可以让我从OpenNLP名称查找模块中找到更多关于所用算法的信息 谢谢你的回复,我

我正在试用阿尔巴尼亚语的OpenNLP。为此,我正在使用OPenNLP,并试图用阿尔巴尼亚语为个人、地点和组织实体识别建立模型。 我正在构建我自己的语料库,但我需要一位开放式NLP专家来确认我的以下疑问: 1-我是否应该为每个模型建立一个单独的语料库,例如,为ner人员建立一个只存在标签的语料库? 2-是否可以在同一语料库中标记人物、地点和组织,并使用它来训练一个能够提取所有三种实体类型的单一模型? 3-是否有资源可以让我从OpenNLP名称查找模块中找到更多关于所用算法的信息


谢谢你的回复,我真的需要你对我的论文的支持

1-我是否应该为每个模型建立一个单独的语料库,例如,为ner人建立一个只存在标签的语料库? 我想是的。。。但是,一个模型可能包含多个名称类型。如果将它们分开,则可以更轻松地更新和迭代地改进给定名称的模型,特别是当它们是大型模型时

2-是否可以在同一语料库中标记人物、地点和组织,并使用它来训练一个能够提取所有三种实体类型的单一模型? 是的,这是可能的,但如果您计划基于每种名称类型构建并优化模型,那么将它们分开对我来说就更容易了

3-是否有资源可以让我从OpenNLP名称查找模块中找到更多关于所用算法的信息? 最好的方法是把源代码拉下来,用一些真实的数据一步一步地遍历代码……这是基于最大熵的