solr查询到目标混合大小写字符串

solr查询到目标混合大小写字符串,solr,lucene,datastax-enterprise,Solr,Lucene,Datastax Enterprise,我有一些电子邮件地址存储有不正确的格式,他们在他们的域混合大小写,我需要能够抓取这些资源,以便我可以纠正他们。这是修复损坏数据的一个特例,我需要使用混合案例域收回所有资源 关于如何进行此查询,我没有第一条线索,也不知道它是否可行。您可以使用正则表达式执行查询,该正则表达式尝试将小写字符与大写字符相匹配。它将取决于地址的存储方式(它将在每个令牌上工作,因此如果链中有小写的FilterFactory,我猜它不会找到任何命中): 这两个查询之间会有重叠,因此请按顺序处理它们,以避免两次执行相同的工作

我有一些电子邮件地址存储有不正确的格式,他们在他们的域混合大小写,我需要能够抓取这些资源,以便我可以纠正他们。这是修复损坏数据的一个特例,我需要使用混合案例域收回所有资源


关于如何进行此查询,我没有第一条线索,也不知道它是否可行。

您可以使用正则表达式执行查询,该正则表达式尝试将小写字符与大写字符相匹配。它将取决于地址的存储方式(它将在每个令牌上工作,因此如果链中有小写的FilterFactory,我猜它不会找到任何命中):

这两个查询之间会有重叠,因此请按顺序处理它们,以避免两次执行相同的工作

# retrieve all those that have a lowercase letter followed by a uppercase letter
q=email:/.*[a-z][A-Z].*/

# retrieve all those that have a uppercase letter followed by a lowercase letter
q=email:/.*[A-Z][a-z].*/