Hadoop 用于tweets表的HiveQL查询_Hadoop_Twitter_Hiveql

Hadoop 用于tweets表的HiveQL查询

hadoop twitter

Hadoop 用于tweets表的HiveQL查询,hadoop,twitter,hiveql,Hadoop,Twitter,Hiveql,我试图重现以下结果：我有我需要的所有原始大数据，我创建了tweets表，但出于某种原因，“更复杂的查询”会导致大量MR作业，并以无可用数据结束。我用的是蜂蜡和它的“查询编辑器” 怎么回事在终端中运行时，查询结果为 MapReduce Jobs Launched: Job 0: Map: 1 Reduce: 1 Cumulative CPU: 6.83 sec HDFS Read: 274 HDFS Write: 96 SUCCESS Job 1: Map: 1 Reduce:

我试图重现以下结果：我有我需要的所有原始大数据，我创建了

tweets

表，但出于某种原因，“更复杂的查询”会导致大量MR作业，并以

无可用数据结束。
我用的是蜂蜡和它的“查询编辑器”
怎么回事
在终端中运行时，查询结果为
MapReduce Jobs Launched: 
Job 0: Map: 1  Reduce: 1   Cumulative CPU: 6.83 sec   HDFS Read: 274 HDFS Write: 96 SUCCESS
Job 1: Map: 1  Reduce: 1   Cumulative CPU: 3.96 sec   HDFS Read: 471 HDFS Write: 0 SUCCESS
Total MapReduce CPU Time Spent: 10 seconds 790 msec
OK
Time taken: 585.312 seconds

，其中0个HDFS写入看起来可疑。
对不起，各位：事实证明，我应该在对表运行任何查询之前将数据加载到表中