如何在使用PHP开发的网站中使用Hadoop和Hive技术?

如何在使用PHP开发的网站中使用Hadoop和Hive技术?,php,hadoop,hive,Php,Hadoop,Hive,我想建立一个数据速度和容量都非常大的项目。 因此,我必须使用大数据概念来实现它 但我不知道如何以及在哪里使用它们。 通过大量的研究,我确实安装了Hadoop和Hive,也得到了 基本知识,但不知道如何进行 有谁能告诉我在哪里使用什么技术,使用PHP好吗?或者我应该使用其他语言吗 任何输入都会有帮助。蜂巢不是数据库。它是HDFS中大型数据集上的批处理SQL引擎 因为数据太大是主要原因之一,这意味着您不应该将该数据公开给用户以供任何web应用程序加载,而不管使用哪种语言—加载查询需要的时间太长。如果

我想建立一个数据速度和容量都非常大的项目。
因此,我必须使用大数据概念来实现它

但我不知道如何以及在哪里使用它们。
通过大量的研究,我确实安装了Hadoop和Hive,也得到了 基本知识,但不知道如何进行

有谁能告诉我在哪里使用什么技术,使用PHP好吗?或者我应该使用其他语言吗


任何输入都会有帮助。

蜂巢不是数据库。它是HDFS中大型数据集上的批处理SQL引擎

因为数据太大是主要原因之一,这意味着您不应该将该数据公开给用户以供任何web应用程序加载,而不管使用哪种语言—加载查询需要的时间太长。如果您存储的数据是很小的结果集(例如数百MBs-几GBs),那么Hadoop可能不是首先存储数据的地方

您希望使用Hive进行的任何查询,都不要期望在任何合理的时间段内(至少通话分钟)将其加载到网站中。如果有任何网站使用Hive作为后端,我会非常惊讶

应使用Cassandra或HBase向面向用户的应用程序显示数据。至少,您可以使用ApacheSqoop将配置单元表导出到一种“物化视图”中,以供MySQL/Postgres中的用户查看,MySQL/Postgres具有完善的PHP驱动程序。换句话说,启动Hive中的大型数据,通过一些提取过程对其进行操作,并将其加载到适当的数据库系统中


Spark Thrift Server、Drill或PrestoDB可以设置为更具交互性的SQL查询,但同样-这些应该用于临时查询,而不是将数据快速拉入网站

使用Apache Phoenix在HBase中运行SQL查询。蜂巢和黑斑羚启动极为缓慢。它不是针对一个网站,而是针对批量作业。ApachePhoenix非常快。但是你不能使用PHP;使用Java。或者使用Apache Thrift运行Java服务器查询Apache Phoenix,然后使用php客户端版本的Thrift访问数据。

类似问题