Regex reg ex组和子组

Regex reg ex组和子组,regex,lucene,solr,Regex,Lucene,Solr,是否可以使用正则表达式捕获整个短语以及连接的短语中的每个单词 因此: smith jones 返回: smith,jones,smithjones 此外,由于其他限制(solr PatternTokenizer),我只能使用一个分组。看起来您不需要额外的工作就无法做到这一点。使用,您仅限于正则表达式的“匹配”部分,因此无法进行替换 为什么不创建您自己的标记器,它使用PatternTokenizer创建的标记流,然后构建一个连接字符串,并在末尾返回

是否可以使用正则表达式捕获整个短语以及连接的短语中的每个单词

因此:

smith jones
返回:

smith,jones,smithjones

此外,由于其他限制(solr PatternTokenizer),我只能使用一个分组。

看起来您不需要额外的工作就无法做到这一点。使用,您仅限于正则表达式的“匹配”部分,因此无法进行替换

为什么不创建您自己的标记器,它使用PatternTokenizer创建的标记流,然后构建一个连接字符串,并在末尾返回