Java HibernateSearch-修改StandardTokenizerFactory以连接所有单词
我在Hibernate类中使用Java HibernateSearch-修改StandardTokenizerFactory以连接所有单词,java,solr,lucene,tokenize,hibernate-search,Java,Solr,Lucene,Tokenize,Hibernate Search,我在Hibernate类中使用StandardTokenizerFactory作为我的@TokenizerDef。我希望保留StandardTokenizerFactory标记单词的方式,但添加另一条规则,通过连接(特别是删除所有空格)字段中的所有单词来创建标记 要实现我的目标,最简单的方法或任何替代方法是什么?我认为您需要的是过滤器链中的另一个令牌过滤器(工厂)。你看过瓦片过滤厂吗?它的功能非常类似,可以配置令牌分隔符。不确定它是否也可以是空字符串。如果没有其他内容,您可以基于ShingleF
StandardTokenizerFactory
作为我的@TokenizerDef
。我希望保留StandardTokenizerFactory
标记单词的方式,但添加另一条规则,通过连接(特别是删除所有空格)字段中的所有单词来创建标记
要实现我的目标,最简单的方法或任何替代方法是什么?我认为您需要的是过滤器链中的另一个令牌过滤器(工厂)。你看过瓦片过滤厂吗?它的功能非常类似,可以配置令牌分隔符。不确定它是否也可以是空字符串。如果没有其他内容,您可以基于ShingleFilterFactory编写自己的连接FilterFactory