Hadoop 用于tweets表的HiveQL查询

Hadoop 用于tweets表的HiveQL查询,hadoop,twitter,hiveql,Hadoop,Twitter,Hiveql,我试图重现以下结果:我有我需要的所有原始大数据,我创建了tweets表,但出于某种原因,“更复杂的查询”会导致大量MR作业,并以无可用数据结束。 我用的是蜂蜡和它的“查询编辑器” 怎么回事 在终端中运行时,查询结果为 MapReduce Jobs Launched: Job 0: Map: 1 Reduce: 1 Cumulative CPU: 6.83 sec HDFS Read: 274 HDFS Write: 96 SUCCESS Job 1: Map: 1 Reduce:

我试图重现以下结果:我有我需要的所有原始大数据,我创建了
tweets
表,但出于某种原因,“更复杂的查询”会导致大量MR作业,并以
无可用数据结束。
我用的是蜂蜡和它的“查询编辑器”

怎么回事

在终端中运行时,查询结果为

MapReduce Jobs Launched: 
Job 0: Map: 1  Reduce: 1   Cumulative CPU: 6.83 sec   HDFS Read: 274 HDFS Write: 96 SUCCESS
Job 1: Map: 1  Reduce: 1   Cumulative CPU: 3.96 sec   HDFS Read: 471 HDFS Write: 0 SUCCESS
Total MapReduce CPU Time Spent: 10 seconds 790 msec
OK
Time taken: 585.312 seconds

,其中0个HDFS写入看起来可疑。

对不起,各位:事实证明,我应该在对表运行任何查询之前将数据加载到表中