pentaho应用服务器集群和carte集群之间的区别

pentaho应用服务器集群和carte集群之间的区别,pentaho,Pentaho,我是pentaho的新手。目前,我们需要对pentaho CE进行集群,以平衡现有转换的负载。但老实说,我们不知道该怎么做 在pentaho文档中,描述了如何对PDI应用程序服务器进行集群。但另一方面,也有文档可以将点菜引擎集群化。要实现可以分发计划作业的集群,我应该集群哪个应用程序?是点菜还是PDI?集群PDI应用服务器和集群点菜引擎之间的区别是什么?谢谢这不是一个新问题,有很多人混淆了Pentaho应用服务器和Pentaho数据集成(Kettle)。感谢营销部将Pentaho收购的所有产品更

我是pentaho的新手。目前,我们需要对pentaho CE进行集群,以平衡现有转换的负载。但老实说,我们不知道该怎么做


在pentaho文档中,描述了如何对PDI应用程序服务器进行集群。但另一方面,也有文档可以将点菜引擎集群化。要实现可以分发计划作业的集群,我应该集群哪个应用程序?是点菜还是PDI?集群PDI应用服务器和集群点菜引擎之间的区别是什么?谢谢

这不是一个新问题,有很多人混淆了Pentaho应用服务器和Pentaho数据集成(Kettle)。感谢营销部将Pentaho收购的所有产品更名为Pentaho。可能将来Pentaho将更名为Vantara,因此它将有助于提前将所有内容混合在一起

如果您想要集群转换执行,您正在处理Pentaho数据集成产品,该产品与Pentaho BA服务器没有直接关系。Pentaho数据集成以前称为Kettle,完全可以不使用Pentaho BA服务器(或Pentaho应用服务器)。以前,所谓的PDI根本不是Pentaho的一部分,取名也不一样,点菜服务器已经就位,是Kettle的一部分。现在所有这些都被称为Pentaho Pentaho Pentaho,从我的观点来看,这就是为什么很难找到Carte和Pentaho BA服务器与生态系统中任何其他服务器之间的区别的根源

简言之,Carte服务器用于执行PDI(kettle)作业/转换。Pentaho服务器是一种web应用程序,用作报表的存储库并承载报表执行引擎。这是完全不同的项目,甚至连在一起进行完美的数据分析

为什么点菜?

点菜服务器来自哪里?它是从水壶里生出来的。水壶本身就是执行转换的工具。它被称为K-et(t)le,因为发明水壶的人是KDE迷(嗨,马特!),他添加了K+etl,因为所有KDE迷都喜欢在他们的产品中添加K作为第一个字母。我可以提到.kjb的文件扩展名.ktr-第一个字母是“K”。所以这个工具叫做水壶。它有UI来创建转换和作业。然后——一个创建来运行xml作业和转换的工具,没有UI——它把Spoon称为笑话,因为主要的工具叫做Ketter。然后-人们制作了Carte服务器-远程服务器或服务器集群来运行ETL作业和转换-因此作为主线,它被称为Carte,就像葡萄酒点菜一样。这是关于命名的

如果您熟悉什么是PDI作业和转换,那么它只是简单的xml元数据文件,描述了要做什么以及如何以及在何处提取信息。它们需要执行引擎。它们可以在UI设计器(PDI UI或kettle)中就地运行,也可以计划在没有UI的情况下运行(这是Spoon执行),也可以在1…n远程服务器上执行,因此这就是Carte执行

Carte本身就是JettyWeb服务器,它启动并侦听传入的xml。请记住,PDI作业或转换—只是xml。它可以是整个xml—这意味着整个转换将按顺序运行,或者是转换的一部分(远程步骤或远程转换)。无论如何,它运行一个java进程,该进程正在等待关于如何提取transfrom和加载的xml元数据

当我们谈论点菜服务器集群时,我们谈论的是一个或多个jetty服务器一起启动。其中一个可以成为大师。如果您将作业/转换发布到主服务器,它将根据kjb/ktr xml启动流程,如果发现此作业/转换设计为在点菜服务器集群上运行,它将发送元数据(在某些情况下是数据),从服务器将执行其部分作业并将数据返回主服务器。关于如何运行作业/转换,有很多详细信息。在carte集群上——想象一下,它是一个或多个jetty服务器,能够执行kettle作业/转换

为什么选择Pentaho BA服务器?

现在谈谈宾托巴·塞弗是怎么出生的

…当我们在上面谈论水壶的开始时,同时完全独立的是一家Pentaho公司,该公司从事BA服务器的创建。他们收购了reporting engine(现在称为Pentaho reporting)、运行mdx查询的Mondrian engine,这是一家非常成功的公司。他们甚至发明了xml形式的x-actions来为BA服务器运行一系列命令。但幸运的是强大的数据提取引擎。然后他们发现了上面提到的一个水壶。这是一个巨大的成功,他们有好的报告引擎,好的报告引擎满足好的数据提取工具。因此,他们收购了Kettle,将其更名为Pentaho Data Integration(他们所有的产品都称为Pentaho),它成为Pentaho BA服务器的一部分

Pentaho BA点菜

它是如何一起工作的?当您在Pentaho BA服务器上运行报告时,它会尝试从任何地方提取一些信息。Pentaho BA服务器包括报告引擎,该引擎负责检索数据以生成报告。如果您已将报告配置为从PDI(以前称为kettle)读取数据,则报告将指向作业(.kjb)或转印(.ktr)。当您在Pentaho BA服务器上执行报告时—Pentaho BA服务器调用报告引擎,发现该报告需要执行ktr/kjb—因此它调用PDI引擎来执行作业或转换以提取数据。作业或转换可以配置为在一个或多个Carte服务器上运行,所以执行时将请求Carte服务器执行此作业或转换。看一看:我们已经请求PentahoBA服务器执行报告。Pentaho BA服务器是一个tomcat服务器。Pentaho BA服务器生成一个报告-但它需要运行PDI引擎-PDI引擎发现我们要执行集群作业或