ApacheSolr vs ApacheSlucy

ApacheSolr vs ApacheSlucy,apache,perl,solr,lucene,apache-lucy,Apache,Perl,Solr,Lucene,Apache Lucy,我有一个用英语编写的web应用程序。我的搜索要求是为文件系统/动态文档编制索引,该文档可以包含文件类型,即:。;HTML、MS Office、PDF文档等,然后执行全文搜索。我已经用样本数据调查了工作情况。现在我开始了解并想知道这是否适合我的基于Perl的应用程序。其中一个问题是,2014年12月之后没有更新。不确定是否积极维护,尤其是与集成的进展情况。我需要以下几点建议: 这几乎和什么相似 生产准备好了吗 新版本的任何暂定计划 谢谢,好的,我将分享我使用Lucy的一些经验 Lucy构建索引

我有一个用英语编写的web应用程序。我的搜索要求是为文件系统/动态文档编制索引,该文档可以包含文件类型,即:。;HTML、MS Office、PDF文档等,然后执行全文搜索。我已经用样本数据调查了工作情况。现在我开始了解并想知道这是否适合我的基于Perl的应用程序。其中一个问题是,2014年12月之后没有更新。不确定是否积极维护,尤其是与集成的进展情况。我需要以下几点建议:

  • 这几乎和什么相似
  • 生产准备好了吗
  • 新版本的任何暂定计划

谢谢,

好的,我将分享我使用Lucy的一些经验

Lucy构建索引时,会在您声明的目录中创建许多索引文件。只有一个用户可以从索引中读取、写入和删除。如果要与多个用户共享索引,则需要应用文件锁定。当一个用户访问索引时,其他用户将被锁定,直到当前访问索引的用户完成。当有大量用户想要访问索引时,这可能是一个问题

Lucy不支持整数类型,因此如果使用数字进行查询,Lucy会将其视为字符串。这也意味着Lucy没有诸如“大于”、“小于”等数字查询函数运算符。也不可能处理日期和时间。另一方面,Solr允许您使用整数和所有可用的查询函数,包括整数、日期、时间等

Lucy几乎没有在线社区支持,更不用说缺少文档了。另一方面,Solr是最流行的基于Lucene的企业搜索引擎。它有大量的社区支持、非常全面的文档和教程

solr的唯一问题是安全性。使用solr创建索引时,它将加载到共享租赁服务器上。这意味着任何人都可以访问您的数据。保护数据的安全取决于您。好消息是有一些插件可以让你这么做


在我看来,Lucy是一个好的、快速的小型搜索引擎,如果你主要用于文本搜索,并且你的网站流量不大。

不幸的是,你的问题可能有点离题,因为堆栈溢出主要集中在特定的代码问题上。我同意@Sobrique。无论如何,为了提供帮助,您可能还需要研究弹性搜索。如果有很多东西,Solr需要一段时间来索引它们。弹性搜索可能会更快。即使是我也有点犹豫是否在这里发布,但无论如何都发布了。可能…将在PerlMonks上发布并在此处关闭。由于river插件贬值,我们也在等待2.0版本对附件进行更多测试。谢谢你的帮助。这个问题对StackOverflow来说有点离题。但是作为ApacheLucy PMC的成员,我可以用“是”回答所有问题。请注意,Lucy是Lucene的一个“松散”端口,不跟踪Lucene版本,只提供一小部分功能。有兴趣知道它提供了哪些功能,哪些没有?这将有助于选择基于Lucene的Solr或lucy。关于Perl,我已经问过同样的问题。谢谢你的反馈。