Regex UIMA RUTA:单词列表中的正则表达式

Regex UIMA RUTA:单词列表中的正则表达式,regex,ruta,Regex,Ruta,有没有办法在WORDLIST中包含正则表达式? 我需要实现中提到的相同功能 或者有没有其他解决方法 编辑: WORDLIST定义为文本项列表。如果我有一个要标记为相同类型的正则表达式列表,该怎么办。有办法吗 例如,我想在文档中查找日期, 但是date有很多格式,所以正则表达式是一种更简洁的方式来涵盖所有可能的情况。 所以我试着使用下面的语法,但唯一的匹配是那些只有一个单词没有特殊正则表达式语法的情况 DECLARE Date; WORDLIST DateFormatList='DateForma

有没有办法在WORDLIST中包含正则表达式? 我需要实现中提到的相同功能

或者有没有其他解决方法

编辑: WORDLIST定义为文本项列表。如果我有一个要标记为相同类型的正则表达式列表,该怎么办。有办法吗

例如,我想在文档中查找日期, 但是date有很多格式,所以正则表达式是一种更简洁的方式来涵盖所有可能的情况。 所以我试着使用下面的语法,但唯一的匹配是那些只有一个单词没有特殊正则表达式语法的情况

DECLARE Date;
WORDLIST DateFormatList='DateFormat.regex';
Document{-> MARKFAST(Date, DateFormat, true,1)};
我可以在规则中更改什么,以便将DateFormatList中的项视为正则表达式


谢谢

如果不是志愿者的话,在不久的将来将不支持单词列表中的正则表达式。问题在于,单词列表在查找过程中使用的是trie而不是FST,这使得所需的功能无法直接实现

在一些罕见的情况下,例如,对于可选序列,可以使用单词表模拟所需的功能

如果您想检测日期,我强烈建议使用UIMA Ruta中的正常规则。合并和利用这些东西更容易。常见的例子是一个非常简单的规则:

ANY{INLIST(MonthsList) -> MARK(Month), MARK(Date,1,3)} 
PERIOD? NUM{REGEXP(".{2,4}") -> MARK(Year)};
如果要坚持使用正则表达式,则可以使用以下列表:

这些规则还支持功能分配和捕获组。要使用的功能的区别在于语法(多个规则而不是简单的列表)和性能(正则表达式按顺序应用)


(我是UIMA Ruta的开发者)

请将链接内容放在此处,您能详细说明您的问题,而不是将我们发送到其他网站吗?我们努力写答案。。。请努力写一个问题。:)
"regexp1" -> Date;
"regexp2" -> Date;
"regexp3" -> Date;