Amazon s3 直接从S3输入文件运行配置单元查询
我正在使用Elastice Map Reduce中的交互式配置单元会话来运行配置单元。以前我将数据从S3加载到配置单元表中。现在,我想在S3输入文件上运行一些脚本,而不将数据加载到配置单元表中Amazon s3 直接从S3输入文件运行配置单元查询,amazon-s3,amazon-web-services,hive,elastic-map-reduce,Amazon S3,Amazon Web Services,Hive,Elastic Map Reduce,我正在使用Elastice Map Reduce中的交互式配置单元会话来运行配置单元。以前我将数据从S3加载到配置单元表中。现在,我想在S3输入文件上运行一些脚本,而不将数据加载到配置单元表中 这可能吗?如果可能,那么如何实现这一点?您可以在S3中对数据运行查询 CREATE EXTERNAL TABLE mydata (key STRING, value INT) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\n' LOCATION 's3n://m
这可能吗?如果可能,那么如何实现这一点?您可以在S3中对数据运行查询
CREATE EXTERNAL TABLE mydata (key STRING, value INT) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\n' LOCATION 's3n://mys3bucket/';
或类似的对于这种类型的“查询”,您可以使用Pig或普通MapReducejobs@guy谢谢你,我发现这是不可能实现的。我尝试将数据复制到表中,但它显示空值。可能我是要清理数据,然后重新加载。