Search 推荐一个简单的搜索引擎搜索单词包?
对于小巧、轻巧、字数众多的搜索引擎有什么建议吗 我有一套“文档”,每一个基本上都是一小袋任意的单词。 给定一个新文档,我需要得到一个“相似”文档的列表,以及它们的相似程度的权重。文件可能很小。。最多几段Search 推荐一个简单的搜索引擎搜索单词包?,search,full-text-search,tags,tagging,Search,Full Text Search,Tags,Tagging,对于小巧、轻巧、字数众多的搜索引擎有什么建议吗 我有一套“文档”,每一个基本上都是一小袋任意的单词。 给定一个新文档,我需要得到一个“相似”文档的列表,以及它们的相似程度的权重。文件可能很小。。最多几段 堵塞可能很好,但要求不高 不需要使用字网进行字扩展 首选开源或免费软件,因为这是一个原型,而不是一个全面的项目 unix/linux平台优先 我将把它作为一个子组件使用,只希望给它提供一个ID文档,然后再搜索与我目前拥有的文档“类似”的文档。或。它们并不十分轻量级,但我不推荐任何更小的,如果
- 堵塞可能很好,但要求不高
- 不需要使用字网进行字扩展
- 首选开源或免费软件,因为这是一个原型,而不是一个全面的项目
- unix/linux平台优先
有额外的字段来搜索可能会很方便。你能在没有数据库(MySQL或Postgresql)的情况下使用Sphinx吗,即直接向它提供文件?是的,使用xmlpipe2来源:是的,我看到了。但是所有的文件都是xml格式的吗?我的观点是Sphinx是一种从表或XML索引数据的解决方案。它不是数据库之外的非结构化数据的解决方案。只需使用所需的xml包装您的文档。。。Solr也是一样(除了Solr有处理二进制文档的Tika),如果你对Solr或Sphinx有疑问,我建议你创建一个真实的问题,而不是把它们作为评论发布。。。