Lucene.Net支持短语:在索引期间,在字段中标记逗号分隔数据(原子)的最佳方法是什么?
我有一个数据库,其中有一列我希望索引,该列的名称以逗号分隔,例如Lucene.Net支持短语:在索引期间,在字段中标记逗号分隔数据(原子)的最佳方法是什么?,lucene,lucene.net,Lucene,Lucene.net,我有一个数据库,其中有一列我希望索引,该列的名称以逗号分隔,例如 User.FullNameList = "Helen Ready, Phil Collins, Brad Paisley" 我更喜欢原子化每个名称(名称作为一个整体可搜索实体)。最好的方法是什么 我是否错过了一个简单的设置选项 标记化分隔符 我有吗 创建子类或编写自己的类 那是我自己的代币器吗 还有别的吗?;) 或者Lucene.net不支持短语 或者它是否足够聪明,能够自动处理这个用例 我肯定我不是第一个这样做的人。谷歌没有产
User.FullNameList = "Helen Ready, Phil Collins, Brad Paisley"
我更喜欢原子化每个名称(名称作为一个整体可搜索实体)。最好的方法是什么
您可以自己用逗号分割字符串,并且——
- 使用关键字分析器为每个名称编制索引(非标记化)
- 或者使用标准分析器为每个名称编制索引,并将搜索结果用引号括起来。确保在每个名称之间索引一个虚拟术语,以便“Ready Phil”与文档不匹配
- 使用关键字分析器为每个名称编制索引(非标记化)
- 或者使用标准分析器为每个名称编制索引,并将搜索结果用引号括起来。确保在每个名称之间索引一个虚拟术语,以便“Ready Phil”与文档不匹配