Search 在单个文档中搜索多个字符串

Search 在单个文档中搜索多个字符串,search,lucene,full-text-search,Search,Lucene,Full Text Search,我有一个100万到10万个字符串的列表,我想看看在一个文档(比如一页文本)中可以找到哪些字符串 我知道我可以使用Lucene(Solr/Elasticsearch)查找包含字符串的所有文档。但事实恰恰相反 我可以根据字符串搜索算法(如,trys等)编写一些特别的解决方案,但我认为我将重新发明轮子。是否有用于此的库/框架 (如果有什么不同的话,我可以将字符串和文档拆分成单词)此用例通常由“Percolator”组件解决。 ApacheSolr[1]和Elasticsearch[2]都提供了这一功能

我有一个100万到10万个字符串的列表,我想看看在一个文档(比如一页文本)中可以找到哪些字符串

我知道我可以使用Lucene(Solr/Elasticsearch)查找包含字符串的所有文档。但事实恰恰相反

我可以根据字符串搜索算法(如,trys等)编写一些特别的解决方案,但我认为我将重新发明轮子。是否有用于此的库/框架


(如果有什么不同的话,我可以将字符串和文档拆分成单词)

此用例通常由“Percolator”组件解决。 ApacheSolr[1]和Elasticsearch[2]都提供了这一功能。 基本上,您可以索引“查询”Q,然后从文档中构建一个查询D,以验证哪些查询与Q匹配

[1] ,


[2]

此用例通常由“Percolator”组件解决。 ApacheSolr[1]和Elasticsearch[2]都提供了这一功能。 基本上,您可以索引“查询”Q,然后从文档中构建一个查询D,以验证哪些查询与Q匹配

[1] ,

[2]