Indexing 如何在solr core中导入索引文档的外部文件

Indexing 如何在solr core中导入索引文档的外部文件,indexing,solr,lucene,core,Indexing,Solr,Lucene,Core,我们正在合作创建一个波斯搜索引擎。 我正在做“索引”部分。 我与Solr合作,为一些英文文档编制索引,看看它是否有效。 成功了!所以现在是波斯索引器的时候了。我为PersianAnalyzer优化了一段代码(例如扩展了停止词集),它可以索引文档。现在,我想将外部波斯索引文档导入核心,以查看索引过程并搜索查询。如何将这些索引文档导入核心? 我有点赶时间,所以我会感谢你的帮助 谢谢, Mahshid您有几种选择: 要从文件中获取内容,最快的选择是使用Solr 另一种选择是编写自定义爬虫/索引器,但这

我们正在合作创建一个波斯搜索引擎。 我正在做“索引”部分。 我与Solr合作,为一些英文文档编制索引,看看它是否有效。 成功了!所以现在是波斯索引器的时候了。我为PersianAnalyzer优化了一段代码(例如扩展了停止词集),它可以索引文档。现在,我想将外部波斯索引文档导入核心,以查看索引过程并搜索查询。如何将这些索引文档导入核心? 我有点赶时间,所以我会感谢你的帮助

谢谢,
Mahshid

您有几种选择:

  • 要从文件中获取内容,最快的选择是使用Solr
  • 另一种选择是编写自定义爬虫/索引器,但这需要时间
  • 如果你需要一个网络爬虫,那么你可以使用