Python 3.x 在Google Colab中下载S3文件

Python 3.x 在Google Colab中下载S3文件,python-3.x,google-colaboratory,python-s3fs,Python 3.x,Google Colaboratory,Python S3fs,我正在做一个项目,碰巧有些数据是以文件系统的形式提供的。我可以使用S3FileSystem.open(path)读取这些数据。但是有360多个文件,读取一个文件至少需要3分钟。我想知道,有没有办法在我的系统中下载这些文件并从那里读取,而不是直接从文件系统读取。还有另一个原因,虽然我可以读取所有这些文件,但一旦我在colab上的会话重新连接,我必须再次重新读取所有这些文件,因此这将花费大量时间。我使用以下代码来读取文件 fs_s3 = s3fs.S3FileSystem(anon=True) s3

我正在做一个项目,碰巧有些数据是以文件系统的形式提供的。我可以使用S3FileSystem.open(path)读取这些数据。但是有360多个文件,读取一个文件至少需要3分钟。我想知道,有没有办法在我的系统中下载这些文件并从那里读取,而不是直接从文件系统读取。还有另一个原因,虽然我可以读取所有这些文件,但一旦我在colab上的会话重新连接,我必须再次重新读取所有这些文件,因此这将花费大量时间。我使用以下代码来读取文件

fs_s3 = s3fs.S3FileSystem(anon=True)
s3path = 'file_name'
remote_file_obj = fs_s3.open(s3path, mode='rb')
ds = xr.open_dataset(remote_file_obj, engine= 'h5netcdf')

有没有办法下载这些文件?

您可以使用另一个
s3fs
装载存储桶,然后将文件复制到Colab

安装后,您可以

!cp /s3/yourfile.zip /content/