Architecture 在Azure数据管道中以一定规模使用外部网络中的文件

Architecture 在Azure数据管道中以一定规模使用外部网络中的文件,architecture,analytics,azure-data-factory,azure-data-lake,azure-databricks,Architecture,Analytics,Azure Data Factory,Azure Data Lake,Azure Databricks,从外部网络大规模使用文件的最佳方式是什么?这里的目标是使用data Factory、ADL和Databricks在Azure中构建数据管道,这些数据管道可以扩展到几乎实时的分析用途。正如我所知,您可以在ADF管道中使用Databricks笔记本活动: 然后,您可以在databricks群集中配置最小工作线程和最大工作线程。请参阅: 我建议您查找Microsoft参考体系结构图,以构建现代数据仓库。这个问题太笼统了。

从外部网络大规模使用文件的最佳方式是什么?这里的目标是使用data Factory、ADL和Databricks在Azure中构建数据管道,这些数据管道可以扩展到几乎实时的分析用途。

正如我所知,您可以在ADF管道中使用Databricks笔记本活动:

然后,您可以在databricks群集中配置最小工作线程和最大工作线程。请参阅:


我建议您查找Microsoft参考体系结构图,以构建现代数据仓库。这个问题太笼统了。