Python 构建端到端数据分析平台
我需要创建一个端到端平台: 输入数据收集和存储-数据将通过FTP定期收集并存储在云中。 数据分析-将使用Tableau/任何其他分析软件分析数据 报告-根据不断变化的输入数据生成的日报和月报。 我需要决定此解决方案可以使用哪种工具/技术,以及如何在线托管脚本/流程以使其24*7运行 我的一个想法是使用AWS和Tableau: 用于数据收集-在Amazon ECS控制台中计划cron作业 对于存储-存储在AWS上-可能是Amazon S3存储 但是,在加载到AmazonS3之前,我是否可以选择格式化/更改数据? 使用Tableau创建仪表板。 但这需要多个Tableau会话,因为不同报告的数据源不同。此外,我需要定期将这些报告/仪表板以电子邮件格式发送给用户。可以在AWS中完成吗? 但是,我相信AWS解决方案对该公司来说成本高昂。还有哪些其他可行的解决办法Python 构建端到端数据分析平台,python,amazon-web-services,amazon-s3,etl,data-pipeline,Python,Amazon Web Services,Amazon S3,Etl,Data Pipeline,我需要创建一个端到端平台: 输入数据收集和存储-数据将通过FTP定期收集并存储在云中。 数据分析-将使用Tableau/任何其他分析软件分析数据 报告-根据不断变化的输入数据生成的日报和月报。 我需要决定此解决方案可以使用哪种工具/技术,以及如何在线托管脚本/流程以使其24*7运行 我的一个想法是使用AWS和Tableau: 用于数据收集-在Amazon ECS控制台中计划cron作业 对于存储-存储在AWS上-可能是Amazon S3存储 但是,在加载到AmazonS3之前,我是否可以选择格式
很抱歉,我对这个领域还不熟悉,很难找到一个经济高效的解决方案。看看如何构建AWS无服务器体系结构。S3>lambda>Athena>quicksight 使用lambda函数以所需格式转换进入s3的数据 使用Athena对数据进行分区和查询,并创建表和数据库 使用tableau摘录,或者更好地使用quicksight 费用取决于数据量。此解决方案每月成本不到10美元,支持10个用户,但这是一个没有任何变量的模糊估计