如何将DocumentDB中的多个集合中的数据源化为Hadoop

如何将DocumentDB中的多个集合中的数据源化为Hadoop,hadoop,mapreduce,azure-cosmosdb,Hadoop,Mapreduce,Azure Cosmosdb,我有一个hadoop工作,它从多个DocumentDB集合中获取数据。在配置与DocumentDB的连接时,我可以使用以下comand设置INOUT\u集合\u名称 conf.set(ConfigurationUtil.INPUT_COLLECTION_NAMES, inputCollName); 我的问题是如果我有不止一个收藏怎么办?如果我不知道我提前有多少个收藏怎么办 请调查一下。希望它符合你的要求。我认为hadoop最适合批处理,这意味着事情不是动态的。快乐编码我的主要问题是当我不知道

我有一个hadoop工作,它从多个DocumentDB集合中获取数据。在配置与DocumentDB的连接时,我可以使用以下comand设置INOUT\u集合\u名称

 conf.set(ConfigurationUtil.INPUT_COLLECTION_NAMES, inputCollName);

我的问题是如果我有不止一个收藏怎么办?如果我不知道我提前有多少个收藏怎么办

请调查一下。希望它符合你的要求。我认为hadoop最适合批处理,这意味着事情不是动态的。快乐编码

我的主要问题是当我不知道我提前有多少收藏时。如何获取所有集合的列表并将其添加到输入集合名称中?