如何排除Solr/Lucene中的某些URL

如何排除Solr/Lucene中的某些URL,lucene,solr,Lucene,Solr,我已经在一个网站上设置了Solr索引的新实例。我希望Solr不要索引某些URL模式。有没有办法提及这种排除模式 问候,, 第可以在程序中执行,仅当模式与排除模式不匹配时才进行索引。可以在程序中执行,仅当模式与排除模式不匹配时才进行索引。您可以使用。在该UpdateRequestProcessor中,如果文档与正则表达式匹配或不匹配,您可以决定是否为文档编制索引。您可以使用。在这个UpdateRequestProcessor中,如果文档与正则表达式不匹配,您可以决定是否为文档编制索引。您是否有一个

我已经在一个网站上设置了Solr索引的新实例。我希望Solr不要索引某些URL模式。有没有办法提及这种排除模式

问候,,

可以在程序中执行,仅当模式与排除模式不匹配时才进行索引。

可以在程序中执行,仅当模式与排除模式不匹配时才进行索引。

您可以使用。在该UpdateRequestProcessor中,如果文档与正则表达式匹配或不匹配,您可以决定是否为文档编制索引。

您可以使用。在这个UpdateRequestProcessor中,如果文档与正则表达式不匹配,您可以决定是否为文档编制索引。

您是否有一个爬虫程序正在运行并收集数据?我倾向于在爬虫程序中执行该逻辑。Solr更像是respository,我不认为这是放置大量索引逻辑的最佳位置


Eric

你是否有一个爬虫在四处活动并收集数据?我倾向于在爬虫程序中执行该逻辑。Solr更像是respository,我不认为这是放置大量索引逻辑的最佳位置

埃里克