具有常规日期读取的SUTime
我正在使用SUutime/stanford nlp,它做得很好,但我不知道如何读取常规日期格式 例如: “我们于1988年10月27日参加了该活动” 它返回空值 对于这样的表达:“我们在1988年10月27日参加了活动”,效果很好 有什么想法吗具有常规日期读取的SUTime,time,nlp,stanford-nlp,sutime,Time,Nlp,Stanford Nlp,Sutime,我正在使用SUutime/stanford nlp,它做得很好,但我不知道如何读取常规日期格式 例如: “我们于1988年10月27日参加了该活动” 它返回空值 对于这样的表达:“我们在1988年10月27日参加了活动”,效果很好 有什么想法吗 干杯我对斯坦福临时软件包没有任何体验,但它可能没有针对这种临时格式进行调整 我建议你看看这个: 基本上基于HeidelTime工作: 好了,各位,我想我明白了 在sutime/english.sutime.txt第319行中,有几个用于US标记的模式:
干杯我对斯坦福临时软件包没有任何体验,但它可能没有针对这种临时格式进行调整 我建议你看看这个: 基本上基于HeidelTime工作:
好了,各位,我想我明白了 在sutime/english.sutime.txt第319行中,有几个用于US标记的模式: {规则类型:“时间”,模式:/yyyy-?MM-?dd-?'T'HH(:?MM(:?ss([,]S{1,3})?)?)?(Z)/}
{规则类型:“时间”,模式:/yyyy-MM-dd/}
{规则类型:“时间”,模式:/'T'HH(:?mm(:?ss(,)?)?)?(Z)/}
#标记器“有时会添加额外的斜杠
{规则类型:“时间”,模式:/yyyy\?/MM\?/dd/}
{规则类型:“时间”,模式:/MM?\?/dd?\?/(yyyy | yy)/}
{规则类型:“时间”,模式:/MM?-dd?-(yyyy | yy)/}
{规则类型:“时间”,模式:/HH?:mm(:ss)?/}
{规则类型:“时间”,模式:/yyy-MM/}
只需要添加一些规则类型,以获得所需的顺序,我将把它放在这里,以防有人发现它有用 问题是某些时间格式不受支持 查看sutime/english.sutime.txt文件,您将看到一行如下所示。其中的TODO显示仍可以添加其他格式。我在我的文件中添加了2个其他格式,如下所示:
# TODO: Support other timezone formats
{ ruleType: "time", pattern: /yyyy-?MM-?dd-?'T'HH(:?mm(:?ss([.,]S{1,3})?)?)?(Z)?/ }
{ ruleType: "time", pattern: /yyyy-MM-dd/ }
{ ruleType: "time", pattern: /'T'HH(:?mm(:?ss([.,](S{1,3}))?)?)?(Z)?/ }
#The entries below are newly added to support other time formats.
{ ruleType: "time", pattern: /dd\/MM\/yyyy/ }
{ ruleType: "time", pattern: /dd-MM-yyyy/ }
新添加的条目使SUTime能够正确识别表单的时间格式:
2014年12月20日或2014年12月28日
这与OPs要求的表单相同。您确定默认情况下不需要美国格式吗?您是否尝试过
10/27/1988
?是的,您是对的。现在我正在寻找更改输入格式的方法。您知道怎么做吗?