Search 推荐一个简单的搜索引擎搜索单词包？_Search_Full Text Search_Tags_Tagging

Search 推荐一个简单的搜索引擎搜索单词包？

search tags

Search 推荐一个简单的搜索引擎搜索单词包？,search,full-text-search,tags,tagging,Search,Full Text Search,Tags,Tagging,对于小巧、轻巧、字数众多的搜索引擎有什么建议吗我有一套“文档”，每一个基本上都是一小袋任意的单词。给定一个新文档，我需要得到一个“相似”文档的列表，以及它们的相似程度的权重。文件可能很小。。最多几段堵塞可能很好，但要求不高不需要使用字网进行字扩展首选开源或免费软件，因为这是一个原型，而不是一个全面的项目 unix/linux平台优先我将把它作为一个子组件使用，只希望给它提供一个ID文档，然后再搜索与我目前拥有的文档“类似”的文档。或。它们并不十分轻量级，但我不推荐任何更小的，如果

对于小巧、轻巧、字数众多的搜索引擎有什么建议吗

我有一套“文档”，每一个基本上都是一小袋任意的单词。给定一个新文档，我需要得到一个“相似”文档的列表，以及它们的相似程度的权重。文件可能很小。。最多几段

堵塞可能很好，但要求不高
不需要使用字网进行字扩展
首选开源或免费软件，因为这是一个原型，而不是一个全面的项目
unix/linux平台优先

我将把它作为一个子组件使用，只希望给它提供一个ID文档，然后再搜索与我目前拥有的文档“类似”的文档。

或。它们并不十分轻量级，但我不推荐任何更小的，如果项目成功并且需要增长，切换搜索引擎可能会很痛苦。

我认为这是一种选择。它应该允许您构建一个自定义的搜索引擎。

是一个纯Python（没有C，没有外部数据库）索引器/搜索引擎。有关更多信息，请查看。它确实支持词干分析

我在一个mediawiki实例的XML转储上试用了它，它似乎运行得很好

我想知道MongoDB的情况

看起来“全文搜索”可能就是我想要的。。。

有额外的字段来搜索可能会很方便。

你能在没有数据库（MySQL或Postgresql）的情况下使用Sphinx吗，即直接向它提供文件？是的，使用xmlpipe2来源：是的，我看到了。但是所有的文件都是xml格式的吗？我的观点是Sphinx是一种从表或XML索引数据的解决方案。它不是数据库之外的非结构化数据的解决方案。只需使用所需的xml包装您的文档。。。Solr也是一样（除了Solr有处理二进制文档的Tika），如果你对Solr或Sphinx有疑问，我建议你创建一个真实的问题，而不是把它们作为评论发布。。。