Lucene 搜索文件内容

Lucene 搜索文件内容,lucene,Lucene,好的,我计划在我的内联网上创建一个本地搜索引擎,搜索像xls、xlsx、doc、docx、pdb等文件的内容 在互联网上搜索后,我想卢克·卢克尼可以用来做这个。我说得对吗? Lucene可以集成到网站中吗 我有500 Gb左右的文件Lucene能处理这么多文件吗?还有别的选择吗 我只知道C和CPP的基础知识。我没有这方面的任何先验知识。我是一个自学成才的人,请给我推荐一本关于Lucene的好书。是的,Lucene可以用于此。但是您需要自己编写一些代码(因为Lucene只是一个库): -爬行代码

好的,我计划在我的内联网上创建一个本地搜索引擎,搜索像xls、xlsx、doc、docx、pdb等文件的内容

在互联网上搜索后,我想卢克·卢克尼可以用来做这个。我说得对吗? Lucene可以集成到网站中吗

我有500 Gb左右的文件Lucene能处理这么多文件吗?还有别的选择吗


我只知道C和CPP的基础知识。我没有这方面的任何先验知识。我是一个自学成才的人,请给我推荐一本关于Lucene的好书。

是的,Lucene可以用于此。但是您需要自己编写一些代码(因为Lucene只是一个库): -爬行代码 -文本抽取 -构建搜索者应用程序


因此,您可能会更好地了解它,它构建在Lucene之上,并具有许多您将使用的内置功能:一个可以使用任何语言访问的可靠服务器,满足您的爬行需求,以及集成文本提取等许多功能

您能给我推荐一本关于solr的好书或任何在线教程吗,我自己拥有ApacheSolr3企业搜索服务器,但现在可能有点过时了。