合并Talend中各种文件中的列
我正在尝试使用Talend实现文件夹中文件的列合并。(文件是本地的) 示例:-文件夹中有4个文件。(可能还有“n”个文件) 每个文件将有一列,其中包含100个值 因此,合并后,输出文件将有4个或“n”个列,其中包含100条记录 是否可以使用Talend组件以这种方式合并 尝试使用tmap中的2个文件,输出记录会成倍增加(第一个文件中的记录*第二个文件中的记录) 任何帮助都将不胜感激合并Talend中各种文件中的列,talend,talend-mdm,Talend,Talend Mdm,我正在尝试使用Talend实现文件夹中文件的列合并。(文件是本地的) 示例:-文件夹中有4个文件。(可能还有“n”个文件) 每个文件将有一列,其中包含100个值 因此,合并后,输出文件将有4个或“n”个列,其中包含100条记录 是否可以使用Talend组件以这种方式合并 尝试使用tmap中的2个文件,输出记录会成倍增加(第一个文件中的记录*第二个文件中的记录) 任何帮助都将不胜感激 谢谢。您必须确定如何连接来自不同文件的数据。 如果每个文件的行号N必须与其他文件的行号N相匹配,则必须在每个文件上
谢谢。您必须确定如何连接来自不同文件的数据。 如果每个文件的行号N必须与其他文件的行号N相匹配,则必须在每个文件上设置一个序列,并加入序列以获得结果。小心,这完全取决于每个文件中数据的顺序 然后你就可以得到这份工作:
tFileInputdelimited_1 --> tMap_1 --->{tMap_5
tFileInputdelimited_2 --> tMap_2 --->{tMap_5
tFileInputdelimited_3 --> tMap_3 --->{tMap_5
tFileInputdelimited_4 --> tMap_4 --->{tMap_5
在从1到4的tmap中,将输入复制到输出,并将“序列”列(数据类型整数)添加到输出中,用Numeric.sequence(“IDENTIFIER1”,1,1)
填充它。然后在输出中有两列:数据和唯一序列。
请注意为每个源使用不同的标识符
然后在tMap_5中,只需加入不同的序列,并获得您的inputColumn。谢谢您的建议,但使用此选项,文件中的列顺序不会保持不变。执行了一个tpivotToColumnsDelimited以合并具有相同序列号的所有记录。现在,我们正在尝试一种方法来改变列的顺序,以合并原始列的顺序。