如何在使用PHP开发的网站中使用Hadoop和Hive技术？_Php_Hadoop_Hive

如何在使用PHP开发的网站中使用Hadoop和Hive技术？

php hadoop hive

如何在使用PHP开发的网站中使用Hadoop和Hive技术？,php,hadoop,hive,Php,Hadoop,Hive,我想建立一个数据速度和容量都非常大的项目。因此，我必须使用大数据概念来实现它但我不知道如何以及在哪里使用它们。通过大量的研究，我确实安装了Hadoop和Hive，也得到了基本知识，但不知道如何进行有谁能告诉我在哪里使用什么技术，使用PHP好吗？或者我应该使用其他语言吗任何输入都会有帮助。蜂巢不是数据库。它是HDFS中大型数据集上的批处理SQL引擎因为数据太大是主要原因之一，这意味着您不应该将该数据公开给用户以供任何web应用程序加载，而不管使用哪种语言—加载查询需要的时间太长。如果

我想建立一个数据速度和容量都非常大的项目。
因此，我必须使用大数据概念来实现它

但我不知道如何以及在哪里使用它们。
通过大量的研究，我确实安装了Hadoop和Hive，也得到了基本知识，但不知道如何进行

有谁能告诉我在哪里使用什么技术，使用PHP好吗？或者我应该使用其他语言吗

任何输入都会有帮助。

蜂巢不是数据库。它是HDFS中大型数据集上的批处理SQL引擎

因为数据太大是主要原因之一，这意味着您不应该将该数据公开给用户以供任何web应用程序加载，而不管使用哪种语言—加载查询需要的时间太长。如果您存储的数据是很小的结果集（例如数百MBs-几GBs），那么Hadoop可能不是首先存储数据的地方

您希望使用Hive进行的任何查询，都不要期望在任何合理的时间段内（至少通话分钟）将其加载到网站中。如果有任何网站使用Hive作为后端，我会非常惊讶

应使用Cassandra或HBase向面向用户的应用程序显示数据。至少，您可以使用ApacheSqoop将配置单元表导出到一种“物化视图”中，以供MySQL/Postgres中的用户查看，MySQL/Postgres具有完善的PHP驱动程序。换句话说，启动Hive中的大型数据，通过一些提取过程对其进行操作，并将其加载到适当的数据库系统中

Spark Thrift Server、Drill或PrestoDB可以设置为更具交互性的SQL查询，但同样-这些应该用于临时查询，而不是将数据快速拉入网站

使用Apache Phoenix在HBase中运行SQL查询。蜂巢和黑斑羚启动极为缓慢。它不是针对一个网站，而是针对批量作业。ApachePhoenix非常快。但是你不能使用PHP；使用Java。或者使用Apache Thrift运行Java服务器查询Apache Phoenix，然后使用php客户端版本的Thrift访问数据。

类似问题