Hadoop Platfora和Datameer的分布

Hadoop Platfora和Datameer的分布,hadoop,analytics,cloudera-cdh,hortonworks-data-platform,mapr,Hadoop,Analytics,Cloudera Cdh,Hortonworks Data Platform,Mapr,我对安装Platfora和Datameer分析工具感兴趣。我的疑问是在这两个工具的文档中,我们看到对于现有的Hadoop发行版,他们给出了兼容列表,包括CDH、HDP和MapR。 但我想在现有的普通Hadoop中安装这些。也就是说,我已经通过逐个下载Apache Hadoop组件安装了Hadoop,并准备了集群 这些工具在这种情况下有效吗?是的,有效。只要您使用“最新的稳定”纱线,HDFS和Map Reduce版本-Datameer将毫无问题地工作。除此之外的任何事情都无关紧要,因为Datame

我对安装Platfora和Datameer分析工具感兴趣。我的疑问是在这两个工具的文档中,我们看到对于现有的Hadoop发行版,他们给出了兼容列表,包括CDH、HDP和MapR。 但我想在现有的普通Hadoop中安装这些。也就是说,我已经通过逐个下载Apache Hadoop组件安装了Hadoop,并准备了集群


这些工具在这种情况下有效吗?

是的,有效。只要您使用“最新的稳定”纱线,HDFS和Map Reduce版本-Datameer将毫无问题地工作。除此之外的任何事情都无关紧要,因为Datameer没有使用Hive、Oozie或任何其他组件,而是将tez、spark等预先打包在应用程序中,并在应用程序上透明运行。到今天为止,我们支持50个不同版本的Hadoop

我显然不能代表Platflora说话,但他们并不是真的在Hadoop上运行,而是将Hadoop中的数据拉入在额外集群上运行的内存列数据库: +额外扩展硬件(内存密集型) +仅自SQL之后的结构化数据(记住Hadoop是以NO-SQL构建的) +仅小数据(因为在内存中) +自基于SQL以来,没有像图形分析这样的高级分析


Stefan(我在Datameer工作)

是的,它能工作。只要您使用“最新的稳定”纱线,HDFS和Map Reduce版本-Datameer将毫无问题地工作。除此之外的任何事情都无关紧要,因为Datameer没有使用Hive、Oozie或任何其他组件,而是将tez、spark等预先打包在应用程序中,并在应用程序上透明运行。到今天为止,我们支持50个不同版本的Hadoop

我显然不能代表Platflora说话,但他们并不是真的在Hadoop上运行,而是将Hadoop中的数据拉入在额外集群上运行的内存列数据库: +额外扩展硬件(内存密集型) +仅自SQL之后的结构化数据(记住Hadoop是以NO-SQL构建的) +仅小数据(因为在内存中) +自基于SQL以来,没有像图形分析这样的高级分析


Stefan(我在Datameer工作)

通过选择Hortonworks的HDP发行版,您可以使用普通Apache Hadoop安装Platfora—HDP发行版的核心是普通Apache Hadoop。(我在Platfora工作。我们支持许多不同的Hadoop发行版,但我们的许多开发实际上是使用普通的ApacheHadoop完成的)


Platfora不仅将Hadoop集群用于输入数据,还通过生成本机MapReduce和Apache Spark作业来处理原始、大容量、结构化或半结构化的输入数据(JSON、XML、日志文件、CSV、Avro、Hive中的数据、其他处理管道和库的输出,您可以随意选择)。这可以很好地扩展,但对于分析问题中的每一个更改,在工作流中使用MapReduce或Spark等延迟更高的框架会让您的周转时间更长,这对生产率不利。这就是为什么Platfora使用支持低延迟视觉发现前端的分布式扩展内存查询引擎访问这些中间结果。这种端到端的方法使得通过交互式(亚秒)可视化和理解PBs中的数据模式变得非常容易视觉体验——类似于Tableau,但Hadoop固有,以及现代多结构数据的规模和复杂性。

您可以选择Hortonworks的HDP发行版,使用普通Apache Hadoop安装Platfora—HDP发行版的核心是普通Apache Hadoop。(我在Platfora工作。我们支持许多不同的Hadoop发行版,但我们的许多开发实际上是使用普通的ApacheHadoop完成的)


Platfora不仅将Hadoop集群用于输入数据,还通过生成本机MapReduce和Apache Spark作业来处理原始、大容量、结构化或半结构化的输入数据(JSON、XML、日志文件、CSV、Avro、Hive中的数据、其他处理管道和库的输出,您可以随意选择)。这可以很好地扩展,但对于分析问题中的每一个更改,在工作流中使用MapReduce或Spark等延迟更高的框架会让您的周转时间更长,这对生产率不利。这就是为什么Platfora使用支持低延迟视觉发现前端的分布式扩展内存查询引擎访问这些中间结果。这种端到端的方法非常容易通过交互式(亚秒)视觉体验可视化和理解PBs中的数据模式——类似于Tableau,但源于Hadoop和现代多结构数据的规模和复杂性。

Hi,感谢您的回复。我将尝试使用本机hadoop在我的一台计算机上安装Datameer。我只是想问一个简单的问题,我想运行以进行评估,我可以在没有许可证的情况下安装吗?总之,我获得了安装Datameer试用版rpm包的链接。您好,感谢您的回复。我将尝试使用本机hadoop在我的一台机器上安装Datameer。我只是想问一个简单的问题,我想运行以进行评估,我可以在没有许可证的情况下安装吗?总之,我获得了安装Datameer试用版rpm包的链接。