Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/date/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Date 从文本中提取日期_Date_Nlp_Stanford Nlp - Fatal编程技术网

Date 从文本中提取日期

Date 从文本中提取日期,date,nlp,stanford-nlp,Date,Nlp,Stanford Nlp,我正在尝试使用斯坦福NLP工具从文本中提取日期(8/11/2012) 给你!用于此工具的演示 你能帮我训练分类器识别日期吗(8/11/2012) 我试着用训练数据作为参考 伍德豪斯佩尔斯酒店 2012年8月18日 ,O 帅哥 但不适用于相同的测试数据。如果这是您试图完成的全部任务,那么使用NLP工具从文本中提取日期似乎有些过分。您应该考虑其他选项,比如简单的java正则表达式(例如)。 如果您正在做一些需要斯坦福NLP工具提供更多功能的事情,请查看注释器。他们会让你感受到它的行为。确保选中选项r

我正在尝试使用斯坦福NLP工具从文本中提取日期(8/11/2012)

给你!用于此工具的演示

你能帮我训练分类器识别日期吗(8/11/2012)

我试着用训练数据作为参考

伍德豪斯佩尔斯酒店 2012年8月18日 ,O 帅哥


但不适用于相同的测试数据。

如果这是您试图完成的全部任务,那么使用NLP工具从文本中提取日期似乎有些过分。您应该考虑其他选项,比如简单的java正则表达式(例如)。 如果您正在做一些需要斯坦福NLP工具提供更多功能的事情,请查看注释器。他们会让你感受到它的行为。确保选中选项
readrules from file
,您将看到您的日期被注释

用法:

SUTime annotations are provided automatically with the StanfordCoreNLP pipeline by including the ner annotator.

您当然可以训练基于CRF的NER识别日期和时间。您可以通过运行提供的english.muc.7class.distsim.crf.ser.gz模型看到一个例子。有关NER系统的培训,请参阅。但请注意,我们的时间/日期识别主要工具现在是基于regex的:SUTime。您还可以为其他应用程序编写SUTime规则。请参阅该页上的和指向TokensRegex的链接。

在sutime/english.sutime.txt第319行中,我们的标记模式很少:

{ ruleType: "time", pattern: /yyyy-?MM-?dd-?'T'HH(:?mm(:?ss([.,]S{1,3})?)?)?(Z)?/ } 
{ ruleType: "time", pattern: /yyyy-MM-dd/ }  
{ ruleType: "time", pattern: /'T'HH(:?mm(:?ss(.,)?)?)?(Z)?/ } 
// Tokenizer "sometimes adds extra slash  
{ ruleType: "time", pattern: /yyyy\?/MM\?/dd/ }  
{ ruleType: "time", pattern: /MM?\?/dd?\?/(yyyy|yy)/ } 
{ ruleType: "time", pattern: /MM?-dd?-(yyyy|yy)/ } 
{ ruleType: "time", pattern: /HH?:mm(:ss)?/ }
{ ruleType: "time", pattern: /yyyy-MM/ }
只需要添加一些规则类型,以获得所需的顺序