Amazon s3 将数据加载到EMR上的配置单元中

Amazon s3 将数据加载到EMR上的配置单元中,amazon-s3,hive,amazon-emr,Amazon S3,Hive,Amazon Emr,我在EMR服务下创建了一个集群,然后与Putty连接。 与此同时,我在构建集群时选择了“presto” 如何将S3或本地计算机上的文件传输到配置单元中 例如,我需要上传学生文件,但是当我运行下面的代码时,我自然会得到一个错误。我应该把学生档案放在哪里 hive > load data local inpath 'student' into table student_nopart; 我想在这里举个例子。 在代码中 load data local inpath ... local表示EM

我在EMR服务下创建了一个集群,然后与Putty连接。 与此同时,我在构建集群时选择了“presto”

如何将S3或本地计算机上的文件传输到配置单元中

例如,我需要上传学生文件,但是当我运行下面的代码时,我自然会得到一个错误。我应该把学生档案放在哪里

hive > load data local inpath 'student' into table student_nopart;
我想在这里举个例子。 在代码中

load data local inpath ...
local
表示EMR节点,而不是您的计算机。通过使用sftp或其他方法,您应该首先将文件上载到EMR并加载它

或者用这个

load data inpath 's3://bucket/path/to/file/' into table <tablename>
将路径“s3://bucket/path/to/file/”中的数据加载到表中

如果S3中已有数据,则可以在S3位置的顶部构建配置单元表或更改现有配置单元表

ALTER TABLE student SET location='s3://bucket/path/to/folder_with_table_files';