Python Spacy未正确识别日期

Python Spacy未正确识别日期,python,machine-learning,nlp,Python,Machine Learning,Nlp,这里spacy无法提取日期时间。我还试过“en”和“en_core_web_lg” 当我们将日期的格式更改为(DD/MM/YYYY)时,我还遇到了一种情况。它可以识别日期 nlp = spacy.load('en_core_web_md') text =" Activity Date: 12/18/2019 06:00:00AM CST " doc = nlp(text) for entity in doc.ents: print(entity.label_+" "+ entity.t

这里spacy无法提取日期时间。我还试过“en”和“en_core_web_lg”

当我们将日期的格式更改为(DD/MM/YYYY)时,我还遇到了一种情况。它可以识别日期

nlp = spacy.load('en_core_web_md')
text =" Activity Date: 12/18/2019 06:00:00AM CST "
doc  = nlp(text)
for entity in doc.ents:
    print(entity.label_+" "+ entity.text)

有没有人遇到过同样的问题。

Spacy使用概率模型来尝试用自然语言识别命名实体。这意味着它给出了命名实体属于某种类型(例如日期、个人或组织)的概率

您可以通过两种方式影响正确识别日期的概率: 确保在日期周围的文本中包含更多上下文线索,即:
该活动发生于2019年12月18日上午06:00:00(美国标准时间)

或者,您也可以在数据集上训练Spacy概率模型,将其输入需要识别日期的位置。更多信息请点击此处:

然而,也许您的用例更适合于正则表达式方法,甚至是日期时间导入到日期识别?这之前已经完成,请检查例如:

对于我的特定用例,我使用日期解析器解决了它。 你可以在这里查一下

text = " 18/12/2019"
doc  = nlp(text)
for entity in doc.ents:
    print(entity.label_+" "+ entity.text)