Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/design-patterns/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Etl 从流式复制数据生成SCD Type 2表的最佳方法是什么?_Etl_Data Warehouse_Cdc_Stream Processing_Scd - Fatal编程技术网

Etl 从流式复制数据生成SCD Type 2表的最佳方法是什么?

Etl 从流式复制数据生成SCD Type 2表的最佳方法是什么?,etl,data-warehouse,cdc,stream-processing,scd,Etl,Data Warehouse,Cdc,Stream Processing,Scd,通常使用ETL实现SCD类型2,但是否可以使用实时数据处理(例如Spark Streaming或KSQL)来实现这一点?Spark-related?或者其他?任何流媒体解决方案都合适。不确定spark是否适合您可能认为的方式。问题太模糊了。基本上,问题是如何建立传统的数据仓库,但使用在线数据源,如CDC向卡夫卡流媒体。当然,可以先将在线数据放到某个阶段,然后使用ETL进行处理。但我想知道如何处理流数据。与Spark相关吗?或者其他?任何流媒体解决方案都合适。不确定spark是否适合您可能认为的方

通常使用ETL实现SCD类型2,但是否可以使用实时数据处理(例如Spark Streaming或KSQL)来实现这一点?

Spark-related?或者其他?任何流媒体解决方案都合适。不确定spark是否适合您可能认为的方式。问题太模糊了。基本上,问题是如何建立传统的数据仓库,但使用在线数据源,如CDC向卡夫卡流媒体。当然,可以先将在线数据放到某个阶段,然后使用ETL进行处理。但我想知道如何处理流数据。与Spark相关吗?或者其他?任何流媒体解决方案都合适。不确定spark是否适合您可能认为的方式。问题太模糊了。基本上,问题是如何建立传统的数据仓库,但使用在线数据源,如CDC向卡夫卡流媒体。当然,可以先将在线数据放到某个阶段,然后使用ETL进行处理。但是我想知道如何使用流数据处理来完成它。