Amazon s3 在AWS上实施cdc和重复数据消除

Amazon s3 在AWS上实施cdc和重复数据消除,amazon-s3,duplicates,etl,cdc,data-lake,Amazon S3,Duplicates,Etl,Cdc,Data Lake,我想在AWS S3中构建一个数据湖,并询问自己如何与CDC合作。我希望避免从源中加载整个数据,而且我希望避免目标中的重复数据。有没有一些行之有效的方法来解决这个问题 您可以参考以下博客: 重复数据消除由AWS Glue通过在原始数据上运行作业来完成。这会将数据转储到另一个bucket,该bucket将镜像复制源数据库。您可以参考以下博客: 重复数据消除由AWS Glue通过在原始数据上运行作业来完成。这会将数据转储到另一个bucket,该bucket将是源数据库的镜像复制。您能否消除CDC

我想在AWS S3中构建一个数据湖,并询问自己如何与CDC合作。我希望避免从源中加载整个数据,而且我希望避免目标中的重复数据。有没有一些行之有效的方法来解决这个问题

您可以参考以下博客:


重复数据消除由AWS Glue通过在原始数据上运行作业来完成。这会将数据转储到另一个bucket,该bucket将镜像复制源数据库。

您可以参考以下博客:


重复数据消除由AWS Glue通过在原始数据上运行作业来完成。这会将数据转储到另一个bucket,该bucket将是源数据库的镜像复制。

您能否消除CDC achronism用法的歧义?这是否意味着IBM CDC(IDR)?您能否消除CDC失谐症的使用歧义?它是指IBM CDC(IDR)吗?