Pentaho匙-等待文件-通配符

Pentaho匙-等待文件-通配符,pentaho,kettle,Pentaho,Kettle,我知道我最近问了几个与pentaho有关的问题,但我正急于在短时间内对其进行评估:) 我正在努力克服的最新障碍是,我正在构建一个作业,该作业将在输入文件到达时处理输入文件,但我只知道文件名的格式,而不知道确切的文件名本身,“等待文件”步骤不允许使用通配符。这似乎是对这样一个步骤的一个明显的批评,所以我想知道我是否错过了一些东西,但在论坛上,似乎我不是唯一一个面临这样一个挑战的人 理想情况下,我需要“等待文件”步骤来搜索通配符/regex,当它找到匹配项时,将结果文件名传递到作业中的下一步进行处理

我知道我最近问了几个与pentaho有关的问题,但我正急于在短时间内对其进行评估:)

我正在努力克服的最新障碍是,我正在构建一个作业,该作业将在输入文件到达时处理输入文件,但我只知道文件名的格式,而不知道确切的文件名本身,“等待文件”步骤不允许使用通配符。这似乎是对这样一个步骤的一个明显的批评,所以我想知道我是否错过了一些东西,但在论坛上,似乎我不是唯一一个面临这样一个挑战的人

理想情况下,我需要“等待文件”步骤来搜索通配符/regex,当它找到匹配项时,将结果文件名传递到作业中的下一步进行处理

有什么建议吗

谢谢


汤姆,我想再次回答你的问题

实际上,您不需要作业来等待文件。根据我关于country split:的回答,您只需要传递源名称,然后使用流程文件将其存档(请参见下图)。

从这里开始,我想您可以使用我之前提供的ktr()来调整我的逻辑

然后,您可以使用作业调度器(参见pic)控制作业的重复(等待和处理文件)。

好吧,希望这对汤姆有帮助

问候,


恐龙我再次尝试回答你的问题

实际上,您不需要作业来等待文件。根据我关于country split:的回答,您只需要传递源名称,然后使用流程文件将其存档(请参见下图)。

从这里开始,我想您可以使用我之前提供的ktr()来调整我的逻辑

然后,您可以使用作业调度器(参见pic)控制作业的重复(等待和处理文件)。

好吧,希望这对汤姆有帮助

问候,


Dino

我有一个类似的需求,通过创建一个专门用于接收文件的目录(从远程主机)解决了这个问题

“获取文件名”步骤读取目录中的文件,并将名称传递到下一步。顺便说一句,“获取文件名”允许使用通配符

(当然,我必须在完成文件处理后清理输入队列。)


编辑:我没有提到,您失去了Get文件名的“wake”功能,您必须循环并计划定期解析目录。

我有一个类似的要求,并通过创建一个专门用于接收文件(来自远程主机)的目录来解决这个问题

“获取文件名”步骤读取目录中的文件,并将名称传递到下一步。顺便说一句,“获取文件名”允许使用通配符

(当然,我必须在完成文件处理后清理输入队列。)


编辑:我没有提到,你失去了“唤醒”功能和获取文件名,你将不得不循环并计划定期解析目录。

你好,迪诺!“在输出中包含文件名”只是将文件名沿链传递,不是吗?ie在这种情况下,它将通过“World Leaders.csv”,但是,如果输入文件不总是被称为“World Leaders.csv”,该怎么办?我需要尝试查看一个文件夹并处理与通配符匹配的文件,例如“*.txt”,以便可以处理具有不同名称的文件。再次感谢。TomHi Tom,将通配符放入文本输入配置中,即正则表达式。那么一切都应该是你想要的。希望能有帮助。汤姆,很高兴能帮上忙。你好,迪诺。再次你好,迪诺!“在输出中包含文件名”只是将文件名沿链传递,不是吗?ie在这种情况下,它将通过“World Leaders.csv”,但是,如果输入文件不总是被称为“World Leaders.csv”,该怎么办?我需要尝试查看一个文件夹并处理与通配符匹配的文件,例如“*.txt”,以便可以处理具有不同名称的文件。再次感谢。TomHi Tom,将通配符放入文本输入配置中,即正则表达式。那么一切都应该是你想要的。希望能有帮助。汤姆,很高兴能帮上忙。你好,迪诺。