Python 使用空间模式匹配器的复杂(重复)规则
我想使用spaCy的模式匹配器匹配重复模式。以下是我想要匹配的模式:Python 使用空间模式匹配器的复杂(重复)规则,python,spacy,matcher,Python,Spacy,Matcher,我想使用spaCy的模式匹配器匹配重复模式。以下是我想要匹配的模式: 我的账号是:2893-26492-634-0924-63。这里有更多的文字。 基本上,尝试匹配以下正则表达式:\d+(\d+)* matcher=matcher(nlp.vocab) add('NUMBER_MERGE',None,[{'IS_DIGIT':True},{'IS_punt':True},{'IS_DIGIT':True},{'IS_SPACE':True}]) 这与342-234文本匹配,但对于342-234
我的账号是:2893-26492-634-0924-63。这里有更多的文字。
基本上,尝试匹配以下正则表达式:\d+(\d+)*
matcher=matcher(nlp.vocab)
add('NUMBER_MERGE',None,[{'IS_DIGIT':True},{'IS_punt':True},{'IS_DIGIT':True},{'IS_SPACE':True}])
这与342-234文本
匹配,但对于342-234-958文本
则失败
我没有找到在一组运算符上应用量词的任何文档。任何帮助都将不胜感激。您可以直接使用正则表达式作为模式
matcher.add('NUMBER_MERGE', None, [{"TEXT": {"REGEX": "\d+(-\d+)*"}}])