Amazon redshift 如何从AWS Aurora(非同步)连续填充红移群集

Amazon redshift 如何从AWS Aurora(非同步)连续填充红移群集,amazon-redshift,amazon-aurora,amazon-dms,Amazon Redshift,Amazon Aurora,Amazon Dms,我有许多MySql数据库(OLTP)运行在AWS Aurora集群上。我还有一个用于OLAP的红移集群。目标是将插入和更改从极光复制到红移,而不是删除。在这种情况下,红移将是一个不断增长的数据存储库,而Aurora数据库将创建、修改和销毁记录——红移记录永远不应该被销毁(至少,不应该作为此复制机制的一部分)。 我在看DMS,但DMS似乎没有从复制中排除删除的粒度。设置我需要的环境的最简单和最有效的方法是什么?我也对第三方解决方案持开放态度,只要它们在AWS中工作 目前有DMS连续同步设置。 可以

我有许多MySql数据库(OLTP)运行在AWS Aurora集群上。我还有一个用于OLAP的红移集群。目标是将插入和更改从极光复制到红移,而不是删除。在这种情况下,红移将是一个不断增长的数据存储库,而Aurora数据库将创建、修改和销毁记录——红移记录永远不应该被销毁(至少,不应该作为此复制机制的一部分)。 我在看DMS,但DMS似乎没有从复制中排除删除的粒度。设置我需要的环境的最简单和最有效的方法是什么?我也对第三方解决方案持开放态度,只要它们在AWS中工作


目前有DMS连续同步设置。

可以考虑使用DMS复制到S3而不是红移,然后使用红移谱(或雅典娜)来对抗S3数据。

S3作为DMS目标是只附加的,所以您永远不会丢失任何东西

这样,事情会变得更加复杂,您可能需要一些ETL来处理这些数据(取决于您的需要)


记录类型为“D”的情况下,您仍然可以进行删除,但您可以根据需要忽略或处理这些删除。

捕获从极光到红移的插入和更新的简单有效方法可能是使用以下方法:

极光触发->Lambda->消防软管->S3->红移

下面的AWS博客文章简化了这个实现,看起来几乎和您的用例相似。 它还提供了示例代码,通过AWS Lambda和Firehose将Aurora表更改为S3。在Firehose中,您可以将目标设置为红移,这将把S3中的数据毫无保留地复制到红移中