在talend中将文件拆分为多个文件

在talend中将文件拆分为多个文件,talend,Talend,我正在寻找一种方法,如何在talend studio中根据实际的文件行分割作业执行-我想处理文件行,从一个作业分支中的DEBUG开始,再从另一个作业分支中的另一行开始。有可能吗?最后,我使用tExctractRegeFields组件——简单定义的正则表达式来匹配行。最重要的,我以前不知道的是,您可以使用不同类型的连接连接组件。我右键单击了已使用的组件a,选择了行>拒绝作业中的新分支,如问题所述。要执行此操作,请使用tMap组件。你的工作会是这样的 t*Input--row-->tMa

我正在寻找一种方法,如何在talend studio中根据实际的文件行分割作业执行-我想处理文件行,从一个作业分支中的DEBUG开始,再从另一个作业分支中的另一行开始。有可能吗?

最后,我使用tExctractRegeFields组件——简单定义的正则表达式来匹配行。最重要的,我以前不知道的是,您可以使用不同类型的连接连接组件。我右键单击了已使用的组件a,选择了行>拒绝作业中的新分支,如问题所述。

要执行此操作,请使用tMap组件。你的工作会是这样的

   t*Input--row-->tMap--out1--->tFileOutput*

                      --out2--->tFileOutput*

在tMap组件中,输入在左侧,输出在右侧。在输出表中,选择Activate expression filter并使用文本框定义过滤器-仅从该连接输出与该过滤器匹配的行。您可以拥有所需的任意多个输出表和过滤器

使用tMap很酷,但如果输出流的数量没有定义和固定,tMap就不是一个好的选择

在这种情况下,使用iterate link或tjavaflex可以帮助您:

看看这篇教程,它解释了如何解决这类任务。实际上只有法语版本。本教程介绍了实现此任务的3种不同技术。

我们可以使用tfileoutputdelimited和tfileinputdelimited来完成此任务。 我们在高级设置中的tfileoutputdelimited中有一个选项,并选中在多个文件中拆分文件的选项