Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 将文件从s3://复制到本地(hadoop)文件系统时出错_Python_Hadoop_Amazon S3_Filesystems_Hdfs - Fatal编程技术网

Python 将文件从s3://复制到本地(hadoop)文件系统时出错

Python 将文件从s3://复制到本地(hadoop)文件系统时出错,python,hadoop,amazon-s3,filesystems,hdfs,Python,Hadoop,Amazon S3,Filesystems,Hdfs,我正在尝试使用python将文件从s3复制到hadoop文件系统。我得到了以下错误: cp: `foo/ds=2015-02-13/ip-d1b-request-2015-02-13_10-00_10-09.txt.gz': No such file or directory 我最近正在迁移最新的hadoop版本(2.4.0)。在版本(0.20)中运行良好。为什么在2.4.0版本中会出现此错误 在Hadoop版本0.20中 hadoop@ip-10-76-38-167:~$ /home/had

我正在尝试使用python将文件从s3复制到hadoop文件系统。我得到了以下错误:

cp: `foo/ds=2015-02-13/ip-d1b-request-2015-02-13_10-00_10-09.txt.gz': No such file or directory
我最近正在迁移最新的hadoop版本(2.4.0)。在版本(0.20)中运行良好。为什么在2.4.0版本中会出现此错误

在Hadoop版本0.20中

hadoop@ip-10-76-38-167:~$ /home/hadoop/bin/hadoop fs -cp s3://test.com/foo/ds=2015-02-13/ip-d1b-request-2015-02-13_10-00_10-09.txt.gz /foo/ds=2015-02-13/ip-d1b-request-2015-02-13_10-00_10-09.txt.gz

15/02/13 11:21:45 INFO s3native.NativeS3FileSystem: Opening 's3://test.com/foo/ds=2015-02-13/ip-d1b-request-2015-02-13_10-00_10-09.txt.gz' for reading
在Hadoop版本2.4.0中

[hadoop@ip-10-169-19-123 ~]$ /home/hadoop/bin/hadoop fs -cp s3://test.com/foo/ds=2015-02-13/ip-d1b-request-2015-02-13_10-00_10-09.txt.gz /foo/ds=2015-02-13/ip-d1b-request-2015-02-13_10-00_10-09.txt.gz

15/02/13 11:21:37 INFO guice.EmrFSBaseModule: Consistency disabled, using com.amazon.ws.emr.hadoop.fs.s3n.S3NativeFileSystem as FileSystem implementation.

15/02/13 11:21:38 INFO fs.EmrFileSystem: Using com.amazon.ws.emr.hadoop.fs.s3n.S3NativeFileSystem as filesystem implementation

cp: `foo/ds=2015-02-13/ip-d1b-request-2015-02-13_10-00_10-09.txt.gz': No such file or directory

你需要像这样尝试。加上“


我自己找到了答案

Using `distcp` instead of `fs -cp`.

此命令可以正常工作。

您是在EMR中工作,还是在使用ec2框复制文件?
Using `distcp` instead of `fs -cp`.