Python 在尝试开发从FTP服务器到AWS S3存储桶的数据管道时,从何开始?

Python 在尝试开发从FTP服务器到AWS S3存储桶的数据管道时,从何开始?,python,amazon-web-services,amazon-s3,data-science,Python,Amazon Web Services,Amazon S3,Data Science,我正在考虑在FTP服务器和AWS S3存储桶之间创建一个管道。具有监控FTP服务器新文件的功能。我想用Python对大部分内容进行编程。我从哪里开始?首先尝试在aws控制台中手动配置数据管道,因为该服务仍然存在缺陷,您希望以最简单的方式开始: 在AWS控制台中访问您的帐户并转到数据管道服务 点击开始按钮,该按钮将打开创建管道菜单 命名管道,在源字段中选择“使用架构师构建”,在计划中选择“关于管道激活” (可选)强烈建议您将日志记录保持为启用状态,并提供一个S3存储桶来保存管道日志,以便以后进行故

我正在考虑在FTP服务器和AWS S3存储桶之间创建一个管道。具有监控FTP服务器新文件的功能。我想用Python对大部分内容进行编程。我从哪里开始?

首先尝试在aws控制台中手动配置数据管道,因为该服务仍然存在缺陷,您希望以最简单的方式开始:

  • 在AWS控制台中访问您的帐户并转到数据管道服务
  • 点击开始按钮,该按钮将打开创建管道菜单
  • 命名管道,在字段中选择“使用架构师构建”,在计划中选择“关于管道激活”
  • (可选)强烈建议您将日志记录保持为启用状态,并提供一个S3存储桶来保存管道日志,以便以后进行故障排除
  • 点击激活按钮,该按钮将打开管道的UI构造函数
  • 在UI图上点击添加按钮并添加一个ShellCommandActivity,您将在其中指定从FTP读取文件/文件夹的bash命令。因为数据管道不支持FTP作为数据源,所以您必须通过这个bash活动来实现
  • 在右菜单上单击“添加可选字段…”并添加Command字段,您将在其中编写从FTP读取的bash命令
  • 再次点击“添加和可选字段…”并选择输出,这将创建一个数据节点
  • 单击该数据节点框,然后在右菜单“添加可选字段…”目录路径中写入目标S3存储桶
  • 保存并激活管道

  • 完成此操作并使管道正常工作后,就可以使用Python了。还不确定您打算如何使用Python。如果您正在考虑在Python脚本中进行数据管道配置,请签出。

    Learn
    boto3
    。您在这里提出了一个非常广泛的问题,但是如果您从熟悉
    bot3
    开始与S3进行交互,您将走上一条很好的入门之路。您的问题在这里并不特别合适,但这是一个有价值的问题。请查收。这属于教程指导的范围,对于堆栈溢出来说太宽了。例如,FTP使用
    ShellCommandActivity