Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/search/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Search 推荐一个简单的搜索引擎搜索单词包?_Search_Full Text Search_Tags_Tagging - Fatal编程技术网

Search 推荐一个简单的搜索引擎搜索单词包?

Search 推荐一个简单的搜索引擎搜索单词包?,search,full-text-search,tags,tagging,Search,Full Text Search,Tags,Tagging,对于小巧、轻巧、字数众多的搜索引擎有什么建议吗 我有一套“文档”,每一个基本上都是一小袋任意的单词。 给定一个新文档,我需要得到一个“相似”文档的列表,以及它们的相似程度的权重。文件可能很小。。最多几段 堵塞可能很好,但要求不高 不需要使用字网进行字扩展 首选开源或免费软件,因为这是一个原型,而不是一个全面的项目 unix/linux平台优先 我将把它作为一个子组件使用,只希望给它提供一个ID文档,然后再搜索与我目前拥有的文档“类似”的文档。或。它们并不十分轻量级,但我不推荐任何更小的,如果

对于小巧、轻巧、字数众多的搜索引擎有什么建议吗

我有一套“文档”,每一个基本上都是一小袋任意的单词。 给定一个新文档,我需要得到一个“相似”文档的列表,以及它们的相似程度的权重。文件可能很小。。最多几段

  • 堵塞可能很好,但要求不高
  • 不需要使用字网进行字扩展
  • 首选开源或免费软件,因为这是一个原型,而不是一个全面的项目
  • unix/linux平台优先
我将把它作为一个子组件使用,只希望给它提供一个ID文档,然后再搜索与我目前拥有的文档“类似”的文档。

或。它们并不十分轻量级,但我不推荐任何更小的,如果项目成功并且需要增长,切换搜索引擎可能会很痛苦。

我认为这是一种选择。它应该允许您构建一个自定义的搜索引擎。

是一个纯Python(没有C,没有外部数据库)索引器/搜索引擎。有关更多信息,请查看。它确实支持词干分析

我在一个mediawiki实例的XML转储上试用了它,它似乎运行得很好

我想知道MongoDB的情况

看起来“全文搜索”可能就是我想要的。。。
有额外的字段来搜索可能会很方便。

你能在没有数据库(MySQL或Postgresql)的情况下使用Sphinx吗,即直接向它提供文件?是的,使用xmlpipe2来源:是的,我看到了。但是所有的文件都是xml格式的吗?我的观点是Sphinx是一种从表或XML索引数据的解决方案。它不是数据库之外的非结构化数据的解决方案。只需使用所需的xml包装您的文档。。。Solr也是一样(除了Solr有处理二进制文档的Tika),如果你对Solr或Sphinx有疑问,我建议你创建一个真实的问题,而不是把它们作为评论发布。。。