Hadoop 将蜂箱从清管器中取出

Hadoop 将蜂箱从清管器中取出,hadoop,cassandra,hive,apache-pig,Hadoop,Cassandra,Hive,Apache Pig,我不熟悉Hive,我使用Pig从Cassandra加载数据,因为在筛选分区键时,从Cassandra()加载数据时遇到了一些问题 因此,计划使用Hive从Cassandra加载数据,并通过Pig对其进行处理。是否可以通过Pig脚本读取Hive输出数据 提前感谢您可以使用。在猪身上看起来是这样的: cassTab=LOAD 'CassTableName' USING org.apache.hcatalog.pig.HCatLoader(); DUMP cassTab; 您可能会找到更多细节和(

我不熟悉
Hive
,我使用
Pig
Cassandra
加载数据,因为在筛选分区键时,从
Cassandra
()加载数据时遇到了一些问题

因此,计划使用Hive从
Cassandra
加载数据,并通过
Pig
对其进行处理。是否可以通过
Pig
脚本读取
Hive
输出数据

提前感谢

您可以使用。在猪身上看起来是这样的:

cassTab=LOAD 'CassTableName' USING org.apache.hcatalog.pig.HCatLoader(); 
DUMP cassTab;

您可能会找到更多细节和(这是色调,但无论如何都会有帮助)。

是的,是的。但是蜂箱可以产生很多不同种类的输出。请更准确地回答你的问题。我计划通过创建外部故事从卡桑德拉加载数据。查询此表并将数据存储在HDF上,如插入覆盖目录“/user/hadoop/output/dir”从cassTab中选择*。可能吗?“CassTableName”是在配置单元中为Cassandra创建的Cassandra表名或外部表名,或者是配置单元的输出目录。假设它是HCatalog中配置单元表的名称。HCatalog允许您查看Pig中的配置单元表。