Java 在Lucene中,有没有办法将首字母缩略词与其扩展名进行匹配?

Java 在Lucene中,有没有办法将首字母缩略词与其扩展名进行匹配?,java,lucene,acronym,Java,Lucene,Acronym,我正在用Lucene为人们的推特和他们的位置建立索引,但人们把奇怪的名字称为位置…然而 是否有方法匹配这些(在索引时间或查询时间)? 1) 美国 2) 美利坚合众国 3) 美国 1) 俄克拉荷马州 2) 嗯 等等 另外,我想要一个解决方案,由于它,我不需要自己编写synonim字典您可以在索引或查询时解决这个问题 在编制索引时,您需要通过在您提供的同义词词典中进行查找来丰富数据,然后使用相同的发布信息对原始术语和同义词进行索引 或者,您可以对查询字符串执行相同的查找,并构建布尔查询“或”-使用原

我正在用Lucene为人们的推特和他们的位置建立索引,但人们把奇怪的名字称为位置…然而

是否有方法匹配这些(在索引时间或查询时间)? 1) 美国 2) 美利坚合众国 3) 美国

1) 俄克拉荷马州 2) 嗯

等等


另外,我想要一个解决方案,由于它,我不需要自己编写synonim字典

您可以在索引或查询时解决这个问题

在编制索引时,您需要通过在您提供的同义词词典中进行查找来丰富数据,然后使用相同的发布信息对原始术语和同义词进行索引


或者,您可以对查询字符串执行相同的查找,并构建布尔查询“或”-使用原始术语和同义词。

是的,但我希望有一个解决方案,其中我不需要自己编写synonims词典。搜索引擎通常支持同义词词典,但是你仍然需要提供字典。好了,没有ootb解决方案可以满足您的需要。如何使用相同的发布信息为两个术语编制索引?我必须创建一个同名的新文本字段吗?也许我会尝试在查询时解决它,因为我不太清楚这一点。如果您有任何示例,请在此处添加一个链接。您可能需要定义自己的Lucene Analyzer,并使用自定义过滤器进行查找和弹出,包括首字母缩略词和扩展版本。然后,您也可以在查询时使用相同的分析器。但这种方法需要在更改映射/同义词后重新索引所有tweet。在您的情况下,您可能希望在查询时像现在这样做。还有一个问题:我无法从文档中理解StandardFilter的确切功能:“规范化使用StandardTokenizer提取的令牌。”。文档中的“规范化”是什么意思?