Apache 企业搜索平台与通用搜索
我有一个关于索尔的问题。它被描述为一个企业搜索平台。是否有面向企业的搜索平台和通用搜索平台?你不能用Solr来建立一个通用的搜索引擎吗?如果有这样的区别,它们之间的主要区别是什么?企业是一个模糊的术语,它附加在一些东西上,表示“是的,你完全可以在专业项目中使用它,它非常好”。简而言之,这是胡说八道。在阅读软件产品(或任何真正的产品)的首页时,我发现忽略所有形容词和副词很有用,这使得第一句话变成:“Solr是ApacheLucene项目的搜索平台。” 不知道为什么我没有被雇来写广告文案Apache 企业搜索平台与通用搜索,apache,search,solr,lucene,full-text-search,Apache,Search,Solr,Lucene,Full Text Search,我有一个关于索尔的问题。它被描述为一个企业搜索平台。是否有面向企业的搜索平台和通用搜索平台?你不能用Solr来建立一个通用的搜索引擎吗?如果有这样的区别,它们之间的主要区别是什么?企业是一个模糊的术语,它附加在一些东西上,表示“是的,你完全可以在专业项目中使用它,它非常好”。简而言之,这是胡说八道。在阅读软件产品(或任何真正的产品)的首页时,我发现忽略所有形容词和副词很有用,这使得第一句话变成:“Solr是ApacheLucene项目的搜索平台。” 不知道为什么我没有被雇来写广告文案 我认为可以
我认为可以公平地说,Solr是一个通用搜索服务器,当然(当然,这取决于您的通用性要求)。它为数据编制索引,允许您对其进行搜索,并提供了许多工具,以最适合您的数据和用户的方式进行搜索。术语搜索语义繁杂。它通常用于表示/描述动作、功能或技术。但关于这个问题,更重要的是,有两种常见的“搜索项目”,即
Web搜索
和企业搜索
项目
Web搜索通常是对一种内容源(Web服务器)的内容进行索引,该内容源以html格式提供内容。大多数情况下,它只涉及公共内容,文档级别的安全性不是问题。这类解决方案的一个典型例子是谷歌的网络搜索,但大多数全文网站搜索解决方案也可以被视为这类解决方案的好例子。对于基本解决方案,一个爬虫、一个html标记移除工具、一个索引库和一些“胶水”就足够了。ApacheNutch或ApacheSolr以及ElasticSearch与web爬虫的结合是实现此类解决方案的良好候选
企业搜索通常是关于整合来自多个内容源的各种格式的内容。这类解决方案的一个典型例子是公司内部网,但基于搜索的应用程序通常也属于这一类。这些解决方案通常附带额外的要求,如支持文档级安全性、高级语言学、元数据提取、数据映射和丰富、同义词等。项目更复杂,需要更复杂的技术堆栈。虽然ApacheSolr或ElasticSearch都可以使用,但许多必需的功能不是标准下载的一部分,需要作为项目的一部分进行开发或集成。但是对于ApacheSolr和ElasticSearch这两个版本,也有商业发行版,它们已经将标准下载的功能扩展到企业搜索的方向。其他好的选择是商业搜索引擎
我同意@femtoRgon的说法,即:
- 是一个很好的通用搜索平台
- 而不是企业搜索平台
- 但是,可以使用Solr构建企业搜索平台
Solr是一个搜索平台,可以针对通用搜索或企业搜索解决方案进行定制。正如Daniel在前面的评论中所建议的,ESearch应用程序专门用于企业/组织搜索组织内部数据,在某些情况下还可以搜索外部内容,但仅与组织相关。企业通常使用内部开发的或由供应商开发的各种系统,ESearch应用程序应能够连接到内部系统并对内容进行索引,包括不同的文件类型、元数据以及与这些系统中的每个文档相关联的重要安全性
总之,Solr是一个搜索系统,可以作为通用或组织的电子搜索应用程序来索引和搜索内容