Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/343.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 构建端到端数据分析平台_Python_Amazon Web Services_Amazon S3_Etl_Data Pipeline - Fatal编程技术网

Python 构建端到端数据分析平台

Python 构建端到端数据分析平台,python,amazon-web-services,amazon-s3,etl,data-pipeline,Python,Amazon Web Services,Amazon S3,Etl,Data Pipeline,我需要创建一个端到端平台: 输入数据收集和存储-数据将通过FTP定期收集并存储在云中。 数据分析-将使用Tableau/任何其他分析软件分析数据 报告-根据不断变化的输入数据生成的日报和月报。 我需要决定此解决方案可以使用哪种工具/技术,以及如何在线托管脚本/流程以使其24*7运行 我的一个想法是使用AWS和Tableau: 用于数据收集-在Amazon ECS控制台中计划cron作业 对于存储-存储在AWS上-可能是Amazon S3存储 但是,在加载到AmazonS3之前,我是否可以选择格式

我需要创建一个端到端平台:

输入数据收集和存储-数据将通过FTP定期收集并存储在云中。 数据分析-将使用Tableau/任何其他分析软件分析数据 报告-根据不断变化的输入数据生成的日报和月报。 我需要决定此解决方案可以使用哪种工具/技术,以及如何在线托管脚本/流程以使其24*7运行

我的一个想法是使用AWS和Tableau:

用于数据收集-在Amazon ECS控制台中计划cron作业 对于存储-存储在AWS上-可能是Amazon S3存储 但是,在加载到AmazonS3之前,我是否可以选择格式化/更改数据? 使用Tableau创建仪表板。 但这需要多个Tableau会话,因为不同报告的数据源不同。此外,我需要定期将这些报告/仪表板以电子邮件格式发送给用户。可以在AWS中完成吗? 但是,我相信AWS解决方案对该公司来说成本高昂。还有哪些其他可行的解决办法


很抱歉,我对这个领域还不熟悉,很难找到一个经济高效的解决方案。

看看如何构建AWS无服务器体系结构。S3>lambda>Athena>quicksight

使用lambda函数以所需格式转换进入s3的数据

使用Athena对数据进行分区和查询,并创建表和数据库

使用tableau摘录,或者更好地使用quicksight

费用取决于数据量。此解决方案每月成本不到10美元,支持10个用户,但这是一个没有任何变量的模糊估计