Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/vim/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
具有常规日期读取的SUTime_Time_Nlp_Stanford Nlp_Sutime - Fatal编程技术网

具有常规日期读取的SUTime

具有常规日期读取的SUTime,time,nlp,stanford-nlp,sutime,Time,Nlp,Stanford Nlp,Sutime,我正在使用SUutime/stanford nlp,它做得很好,但我不知道如何读取常规日期格式 例如: “我们于1988年10月27日参加了该活动” 它返回空值 对于这样的表达:“我们在1988年10月27日参加了活动”,效果很好 有什么想法吗 干杯我对斯坦福临时软件包没有任何体验,但它可能没有针对这种临时格式进行调整 我建议你看看这个: 基本上基于HeidelTime工作: 好了,各位,我想我明白了 在sutime/english.sutime.txt第319行中,有几个用于US标记的模式:

我正在使用SUutime/stanford nlp,它做得很好,但我不知道如何读取常规日期格式

例如:

“我们于1988年10月27日参加了该活动”

它返回空值

对于这样的表达:“我们在1988年10月27日参加了活动”,效果很好

有什么想法吗


干杯

我对斯坦福临时软件包没有任何体验,但它可能没有针对这种临时格式进行调整

我建议你看看这个:

基本上基于HeidelTime工作:
好了,各位,我想我明白了

在sutime/english.sutime.txt第319行中,有几个用于US标记的模式:

{规则类型:“时间”,模式:/yyyy-?MM-?dd-?'T'HH(:?MM(:?ss([,]S{1,3})?)?)?(Z)/}
{规则类型:“时间”,模式:/yyyy-MM-dd/}
{规则类型:“时间”,模式:/'T'HH(:?mm(:?ss(,)?)?)?(Z)/}
#标记器“有时会添加额外的斜杠
{规则类型:“时间”,模式:/yyyy\?/MM\?/dd/}
{规则类型:“时间”,模式:/MM?\?/dd?\?/(yyyy | yy)/}
{规则类型:“时间”,模式:/MM?-dd?-(yyyy | yy)/}
{规则类型:“时间”,模式:/HH?:mm(:ss)?/}
{规则类型:“时间”,模式:/yyy-MM/}


只需要添加一些规则类型,以获得所需的顺序,我将把它放在这里,以防有人发现它有用

问题是某些时间格式不受支持

查看sutime/english.sutime.txt文件,您将看到一行如下所示。其中的TODO显示仍可以添加其他格式。我在我的文件中添加了2个其他格式,如下所示:

  # TODO: Support other timezone formats
  { ruleType: "time", pattern: /yyyy-?MM-?dd-?'T'HH(:?mm(:?ss([.,]S{1,3})?)?)?(Z)?/ }
  { ruleType: "time", pattern: /yyyy-MM-dd/ }
  { ruleType: "time", pattern: /'T'HH(:?mm(:?ss([.,](S{1,3}))?)?)?(Z)?/ }
  #The entries below are newly added to support other time formats.
  { ruleType: "time", pattern: /dd\/MM\/yyyy/ }
  { ruleType: "time", pattern: /dd-MM-yyyy/ }
新添加的条目使SUTime能够正确识别表单的时间格式:

2014年12月20日或2014年12月28日


这与OPs要求的表单相同。

您确定默认情况下不需要美国格式吗?您是否尝试过
10/27/1988
?是的,您是对的。现在我正在寻找更改输入格式的方法。您知道怎么做吗?