Azure data factory Azure Data factory基于列中的多个值在csv中添加其他行

Azure data factory Azure Data factory基于列中的多个值在csv中添加其他行,azure-data-factory,azure-data-factory-2,Azure Data Factory,Azure Data Factory 2,我在Azure blob中有一个excel文件,我将其转换为csv文件,并对该文件执行一些转换。excel文件是当天产品价值的列表。因此,这些列类似于数据、产品名称和值。产品名称是以空格分隔的不同产品的列表 如果每个产品名称都扩展到一个单独的行中,如何对该数据集进行反规范化。 示例如下表所示 Date | Products | Value 20-02-2019 | prod_1 prod_2 prod_3 | 43 20-02-2019 | prod_4 | 32 21-02-2019 | pr

我在Azure blob中有一个excel文件,我将其转换为csv文件,并对该文件执行一些转换。excel文件是当天产品价值的列表。因此,这些列类似于数据、产品名称和值。产品名称是以空格分隔的不同产品的列表

如果每个产品名称都扩展到一个单独的行中,如何对该数据集进行反规范化。 示例如下表所示

Date | Products | Value
20-02-2019 | prod_1 prod_2 prod_3 | 43
20-02-2019 | prod_4 | 32
21-02-2019 | prod_1 prod_4 | 32
21-02-2019 | prod_2 | 40
应该转化为

Date | Product | Values
20-02-2019 | prod_1 | 43
20-02-2019 | prod_2 | 43
20-02-2019 | prod_3 | 43
20-02-2019 | prod_4 | 32
21-02-2019 | prod_1 | 32
21-02-2019 | prod_4 | 32
21-02-2019 | prod_2 | 40

我已经研究了映射数据流和改变行,但它们都需要一个数据库作为接收器。我对ADF比较陌生,所以想知道是否有办法将转换存储在blob中?

您可以在ADF数据流中执行此操作,并将其放入blob文件夹。只有在执行更新/删除/升级操作时才需要Alter Row。

添加解决方案并双击@Mark Kromer MSFT所说的内容。通过使用 派生列-我在空间“”上拆分了Products列。这给出了一个包含poduct名称的数组。我使用展平活动展开副产品。然后我使用了过滤器活动(在youe数据集中,管道和产品名称(eg)| prod_1之间有一个空格)。下面的动画将使实现更加清晰


这实际上是一个Excel文件还是按照示例数据分隔的管道?实际文件是一个Excel文件。我只是在这里展示文件中的数据是什么样子的。哦,这非常有用。谢谢。