时间和日期的OpenNLP名称实体识别模型

时间和日期的OpenNLP名称实体识别模型,nlp,opennlp,Nlp,Opennlp,我正在使用OpenNLP模型进行名称实体识别 我在传递句子,我想在其中识别单词。 OpenNLP需要一个String[]变量,因此我将字符串拆分为以空格分隔的单词 我面临着识别日期的问题。例如,如果字符串包含日期:2012年1月7日,我将字符串拆分为单词,“7”、“1”和“2012”将被分隔为3个不同的单词。虽然它们被识别为日期,但3个不同的标记对我来说没有意义,无法进一步处理。 我怎么可能拆分我的字符串,以便“2012年1月2日”可以作为一个字符串。。。 2012年1月7日是一种格式。。。有时

我正在使用OpenNLP模型进行名称实体识别

我在传递句子,我想在其中识别单词。 OpenNLP需要一个String[]变量,因此我将字符串拆分为以空格分隔的单词

我面临着识别日期的问题。例如,如果字符串包含日期:2012年1月7日,我将字符串拆分为单词,“7”、“1”和“2012”将被分隔为3个不同的单词。虽然它们被识别为日期,但3个不同的标记对我来说没有意义,无法进一步处理。 我怎么可能拆分我的字符串,以便“2012年1月2日”可以作为一个字符串。。。 2012年1月7日是一种格式。。。有时也是2012年1月7日。Date还识别我输入的时间格式:如12:18 pm


NER时间模型无法识别12:18pm或09:52:52的时间。。它接受什么样的时间格式?

Apache OpenNLP日期和时间模型是统计的,是从语料库中训练出来的。它将从上下文识别日期和时间,而不仅仅是从格式识别

如果您有特殊需要,您可以创建自己的语料库和自己的OpenNLP名称 查找器模型

OpenNLP Name Finder还支持在培训时进行一些定制。也许如果你创建一个语料库,并添加一些,你可以改善你的结果