正在寻找一个替代解决方案来处理从Azure Blob到Azure SQL DB的成千上万个JSON_Azure_Etl_Pipeline_Databricks

正在寻找一个替代解决方案来处理从Azure Blob到Azure SQL DB的成千上万个JSON

azure

正在寻找一个替代解决方案来处理从Azure Blob到Azure SQL DB的成千上万个JSON,azure,etl,pipeline,databricks,Azure,Etl,Pipeline,Databricks,我目前开发的管道利用Azure Data Factory进行编排，利用Azure DataBricks进行计算，以执行以下操作。。。我实时接收数万个单记录json文件到Azure Blob中，并在15分钟内检查文件夹中是否有任何新文件，一旦发现，我就使用DataRicks将其加载到数据帧中，并将其加载到SQL DB中的单个文件中，然后让其他ADF作业触发存储过程，然后将数据转换为最终SQL表。。。。我们希望从Databricks转移出去，因为我们并不是为了它的真正功能而使用它，而是为了支付Dat

我目前开发的管道利用Azure Data Factory进行编排，利用Azure DataBricks进行计算，以执行以下操作。。。我实时接收数万个单记录json文件到Azure Blob中，并在15分钟内检查文件夹中是否有任何新文件，一旦发现，我就使用DataRicks将其加载到数据帧中，并将其加载到SQL DB中的单个文件中，然后让其他ADF作业触发存储过程，然后将数据转换为最终SQL表。。。。我们希望从Databricks转移出去，因为我们并不是为了它的真正功能而使用它，而是为了支付Databricks的成本。正在寻找其他解决方案的想法，以便定期（即15分钟）将数万个JSON加载到SQL DB中（最少或不进行转换）。我们是一家microsoft商店，因此不打算离开Azure工具。

以下是一些想法：

使用Azure函数+Blob触发器/事件网格实时处理JSON文件（每次新JSON文件到达时，它都会触发您的函数）。然后，您可以插入到最终表中，也可以插入到临时表中
另一个想法是将Azure功能与Blob触发器/事件网格相结合，将数据放入数据湖。您可以使用ADF将其下沉到SQL最终表

使用Azure函数+Blob触发器/事件网格实时处理JSON文件（每次新JSON文件到达时，它都会触发您的函数）。然后，您可以插入到最终表中，也可以插入到临时表中
另一个想法是将Azure功能与Blob触发器/事件网格相结合，将数据放入数据湖。您可以使用ADF将其下沉到SQL最终表

OPENROWSET

OPENJSON

OPENROWSET

OPENJSON