将DocumentDB集合移动到Azure Data Lake存储

将DocumentDB集合移动到Azure Data Lake存储,azure,azure-data-factory,azure-data-lake,u-sql,Azure,Azure Data Factory,Azure Data Lake,U Sql,我想知道将documentDB移动到Azure Data Lake存储的最佳实践是什么。 我应该为集合中的每个文档创建一个文件还是移动整个documentDB? 我也没有找到关于如何使用U-SQL访问documentDB的更多信息 请输入。您目前无法使用U-SQL访问DocumentDB(或现在称为CosmosDB)中的数据。有一个功能请求。请随意添加您的投票 如果您移动数据,组织将取决于您希望如何管理数据(删除全部或仅删除部分?),数据的结构(将类似的结构化数据保存在一起,保存在同一文件或同一

我想知道将documentDB移动到Azure Data Lake存储的最佳实践是什么。 我应该为集合中的每个文档创建一个文件还是移动整个documentDB? 我也没有找到关于如何使用U-SQL访问documentDB的更多信息


请输入。

您目前无法使用U-SQL访问DocumentDB(或现在称为CosmosDB)中的数据。有一个功能请求。请随意添加您的投票


如果您移动数据,组织将取决于您希望如何管理数据(删除全部或仅删除部分?),数据的结构(将类似的结构化数据保存在一起,保存在同一文件或同一文件夹中),以及您如何使用数据(始终需要所有数据?或仅部分?),以及是什么使您能够以最佳性能访问数据(较大的文件通常更好,但如果它们是JSON,也要确保提取过程有效)。

您可以使用Azure Data Factory连接到文档数据库并将数据存储在Data Lake上。
之后,您可以使用U-SQL直接从data Lake查询数据。

我想我需要问您为什么要这样做?DocDB和ADL是用于不同目的的不同工具。这是永久性的移动。还是您只想将数据复制到ADL以进行报告?如果是,您是否考虑过使用data Lake analytics服务中的表?到sim卡plify it我有许多日志文件发送到ADL。我还有一个documentDB,其中包含每个文件的附加信息(不要问我为什么,但这就是它的设置方式)。因此,每个日志文件都有一个匹配的documentdb文档。documentdb以json文件的形式存储在ADL中。我可以查询json文件,但似乎无法将其存储为documentdb并直接查询(最好将其索引)。