Nlp 识别文本的命名实体识别问题;“下星期一”;日期?

Nlp 识别文本的命名实体识别问题;“下星期一”;日期?,nlp,stanford-nlp,opennlp,gate,Nlp,Stanford Nlp,Opennlp,Gate,我不熟悉文本挖掘和NLP。我试图使用命名实体识别(NER)(斯坦福命名实体标记器)从给定文本中提取日期。我正在使用斯坦福NLP和盖特安妮提供的在线演示 此演示无法将完整的“上周日”、“下周一”、“本月底”、“直到本周日晚上”等文本识别为日期。仅周日或周一无法确定日期。是否有任何选项可以提取给定示例文本中提到的实际文本 示例文本: 用彪马款待自己,因为它提供50%的折扣。该报盘有效期至本周日。购物愉快 提取日期:2013年8月25日(考虑到今天是2013年8月19日。日期格式可以是任何格式) 任何

我不熟悉文本挖掘和NLP。我试图使用命名实体识别(NER)(斯坦福命名实体标记器)从给定文本中提取日期。我正在使用斯坦福NLP和盖特安妮提供的在线演示

此演示无法将完整的“上周日”、“下周一”、“本月底”、“直到本周日晚上”等文本识别为日期。仅周日或周一无法确定日期。是否有任何选项可以提取给定示例文本中提到的实际文本

示例文本:

用彪马款待自己,因为它提供50%的折扣。该报盘有效期至本周日。购物愉快

提取日期:2013年8月25日(考虑到今天是2013年8月19日。日期格式可以是任何格式)

任何库都提供这种日期识别功能,或者是否可以构建自定义模型来识别示例文本中给出的日期

GATE中的插件可以做到这一点,默认情况下,它会根据今天的日期规范化相对日期表达式。您可以使用
sourceOfDocumentDate
参数覆盖该参数,以从文档功能或管道中上一步创建的注释中获取参考日期,而不是使用当前日期(例如,如果您正在处理新闻文章,您可能希望根据发布日期而不是管道运行的日期进行规范化)

虽然插件被称为日期“规范化器”,但实际上它是一个“标记器和规范化器”-它在文本中查找日期表达式并使用规范化值对其进行注释,而不是获取预先存在的
date
注释列表并对其进行规范化。

在Stanford CoreNLP中,可以进行时间识别。该页面包括示例代码,并提供在线演示


相关问题:

作为评论,像“上周日”、“下周一”这样的表达都不是命名实体。这就是为什么标记者不能识别它的原因。