Machine learning 如何训练OpenNLP模型提取多集合词

Machine learning 如何训练OpenNLP模型提取多集合词,machine-learning,nlp,opennlp,named-entity-recognition,Machine Learning,Nlp,Opennlp,Named Entity Recognition,我是使用NER打开NLP-实体提取的新手,我在Open NLP NER中培训并评估了实体提取的模型,当我用一个单词的实体输入文本时效果很好,例如:“我想买吉百利” 但它不适用于多词场景,例如:“我想买一台苹果MacBook” 如何训练模型选择多个单词 PS:我知道我需要做一些与NLP中提供的Bigram相关的事情,但是我如何使用OpenNLP呢?您需要提供涵盖多单词跨度的培训数据。示例来自: 61岁的Pierre Vinken将于11月29日以非执行董事的身份加入董事会。先生维肯是荷兰出版集团爱

我是使用NER打开NLP-实体提取的新手,我在Open NLP NER中培训并评估了实体提取的模型,当我用一个单词的实体输入文本时效果很好,例如:“我想买吉百利”

但它不适用于多词场景,例如:“我想买一台苹果MacBook”

如何训练模型选择多个单词


PS:我知道我需要做一些与NLP中提供的Bigram相关的事情,但是我如何使用OpenNLP呢?

您需要提供涵盖多单词跨度的培训数据。示例来自:

61岁的Pierre Vinken将于11月29日以非执行董事的身份加入董事会。先生维肯是荷兰出版集团爱思唯尔公司的董事长。

除上述格式外,其他格式也很常见

在您的示例中,
Apple MacBook
可以是类型为
Product Name
的一个实体,也可以是两个实体,
Apple
作为
Company Name
MacBook
作为
Product Name
。这完全取决于你的训练数据


您可以手动或使用可视化方式创建这样的数据

您需要提供涵盖多单词跨度的培训数据。示例来自:

61岁的Pierre Vinken将于11月29日以非执行董事的身份加入董事会。先生维肯是荷兰出版集团爱思唯尔公司的董事长。

除上述格式外,其他格式也很常见

在您的示例中,
Apple MacBook
可以是类型为
Product Name
的一个实体,也可以是两个实体,
Apple
作为
Company Name
MacBook
作为
Product Name
。这完全取决于你的训练数据

您可以手动或使用可视化方式创建这样的数据