使用Lucidworks Fusion代替常规Solr的利弊

使用Lucidworks Fusion代替常规Solr的利弊,solr,lucene,lucidworks,Solr,Lucene,Lucidworks,我想知道使用Fusion而不是常规Solr的优缺点是什么?你们能举一些例子吗(比如一些可以用Fusion轻松解决的问题)?首先,我应该透露我是Lucidworks Fusion的产品经理 您似乎已经意识到Fusion与Solr(或一个或多个Solr集群或实例)一起工作,使用Solr进行数据存储和查询。Fusion的目的是使Solr的使用更容易,集成Solr,并构建利用Solr的复杂解决方案。许多人认为Fusion提供的一些有用的功能包括: 连接器和连接器框架。Bare Solr为您提供了一个良

我想知道使用Fusion而不是常规Solr的优缺点是什么?你们能举一些例子吗(比如一些可以用Fusion轻松解决的问题)?

首先,我应该透露我是Lucidworks Fusion的产品经理

您似乎已经意识到Fusion与Solr(或一个或多个Solr集群或实例)一起工作,使用Solr进行数据存储和查询。Fusion的目的是使Solr的使用更容易,集成Solr,并构建利用Solr的复杂解决方案。许多人认为Fusion提供的一些有用的功能包括:

  • 连接器和连接器框架。Bare Solr为您提供了一个良好的API,并能够在命令行中推送特定类型的文件。Fusion附带了几个预构建的数据源连接器,这些连接器从各种类型的系统中获取数据,并根据需要进行处理(包括解析、转换和字段映射),然后将结果发送给Solr。这些连接器包括公共文档存储(云和内部部署)、关系数据库、NoSQL数据存储、HDF、企业应用程序以及一个功能强大且可配置的web爬虫
  • 安全集成。Solr没有任何身份验证或授权(尽管从本周的5.2版开始,它有一个可插入的API和用于身份验证的Kerberos的基本实现)。Fusion用一个安全版本包装SolrAPI。Fusion已干净地集成到LDAP、Active Directory和Kerberos中进行身份验证。它还有一个用于管理和配置Fusion和Solr的细粒度授权模型。而且,Fusion authorizations模型可以自动将LDAP/AD中的组成员身份与Fusion Connectors数据源中的访问控制列表链接起来,以便在运行搜索查询时从源系统镜像文档级访问控制
  • 管道处理模型。Fusion提供了一个带有模块化阶段(API和GUI形式)的管道模型,使定义和编辑数据和文档的转换更加容易。它类似于unix shell管道。例如,在编制索引时,您可以在写入Solr之前包括定义字段映射、计算新字段、聚合文档、从其他源提取数据等阶段。查询时,您可以执行相同的操作,同时转换查询、运行和返回其他分析的结果,以及应用安全筛选
  • 管理GUI。Fusion有一个web UI,用于查看和配置上述内容(以及基本Solr配置)。我们认为这对于那些想要使用Solr的人来说是很方便的,但是他们没有经常使用Solr来记住如何使用API、配置文件和命令行工具
  • 复杂的基于搜索的功能:使用上述管道模型,Fusion包括(并易于使用)一些更丰富的基于搜索的组件,包括:自然语言处理和实体提取模块;实时信号驱动的相关性调整。我们打算在未来提供更多此类服务
  • 分析处理:Fusion包括并集成了ApacheSpark,用于对存储在Solr中的数据(或存储在Solr中的数据)运行深度分析。虽然Solr隐含了某些数据分析功能,但这并不是它的主要目的。我们使用ApacheSpark来驱动Fusion的信号提取和相关性调整,并希望公开API,以便用户可以轻松地在那里运行其他处理
  • 其他:许多有用的杂项功能,如:仪表板UI;具有手动关联性调整的基本搜索界面;更容易监测;作业管理和调度;实时警报与电子邮件集成,等等

当然,上面的许多内容都可以在没有Fusion的情况下针对Solr构建或编写,但我们认为,提供这些类型的企业集成对许多人来说都是有价值的。

因为您是lucidworks Fusion的产品经理,我能问一下Fusion什么时候会实施Solr 5吗?以及,当这种情况发生时,您会提供迁移工具吗?感谢您的回答,祝您生活愉快。当前版本的Fusion已经支持Solr 5.x,但没有随附。您可以单独下载InstallSolr5.x并指向Fusion。Fusion的下一个版本预计将包括Solr 5.x.@gkanapathy是否有可能将SolrInputDocument推入Fusion?