Hadoop 将蜂箱从清管器中取出
我不熟悉Hadoop 将蜂箱从清管器中取出,hadoop,cassandra,hive,apache-pig,Hadoop,Cassandra,Hive,Apache Pig,我不熟悉Hive,我使用Pig从Cassandra加载数据,因为在筛选分区键时,从Cassandra()加载数据时遇到了一些问题 因此,计划使用Hive从Cassandra加载数据,并通过Pig对其进行处理。是否可以通过Pig脚本读取Hive输出数据 提前感谢您可以使用。在猪身上看起来是这样的: cassTab=LOAD 'CassTableName' USING org.apache.hcatalog.pig.HCatLoader(); DUMP cassTab; 您可能会找到更多细节和(
Hive
,我使用Pig
从Cassandra
加载数据,因为在筛选分区键时,从Cassandra
()加载数据时遇到了一些问题
因此,计划使用Hive从Cassandra
加载数据,并通过Pig
对其进行处理。是否可以通过Pig
脚本读取Hive
输出数据
提前感谢您可以使用。在猪身上看起来是这样的:
cassTab=LOAD 'CassTableName' USING org.apache.hcatalog.pig.HCatLoader();
DUMP cassTab;
您可能会找到更多细节和(这是色调,但无论如何都会有帮助)。是的,是的。但是蜂箱可以产生很多不同种类的输出。请更准确地回答你的问题。我计划通过创建外部故事从卡桑德拉加载数据。查询此表并将数据存储在HDF上,如插入覆盖目录“/user/hadoop/output/dir”从cassTab中选择*。可能吗?“CassTableName”是在配置单元中为Cassandra创建的Cassandra表名或外部表名,或者是配置单元的输出目录。假设它是HCatalog中配置单元表的名称。HCatalog允许您查看Pig中的配置单元表。