Kettle 跳过釜上csv读取的第一行

Kettle 跳过釜上csv读取的第一行,kettle,pentaho-spoon,pentaho-data-integration,pdi,Kettle,Pentaho Spoon,Pentaho Data Integration,Pdi,您好,当我将csv文件导入Kettle Pentaho PDI 8.1.0时,我正在尝试跳过csv文件的第一行 第一行有分隔符声明 sep= 第二行有标题。第一行的原因“获取字段”按钮仅读取两个变量。第一个是sep=,第二个没有设置名称 我试图将标题行设置为2,也就是escape sep=也可以使用设置为1的文档标题行来转义第一行,但是“获取字段”按钮无法识别标题 还有其他想法吗?Get字段将始终查看第一行。您需要手动输入字段列表 如果您在正确的轨道上,将headers设置为2,它将正确读取数据

您好,当我将csv文件导入Kettle Pentaho PDI 8.1.0时,我正在尝试跳过csv文件的第一行

第一行有分隔符声明

sep=

第二行有标题。第一行的原因“获取字段”按钮仅读取两个变量。第一个是sep=,第二个没有设置名称

我试图将标题行设置为2,也就是escape sep=也可以使用设置为1的文档标题行来转义第一行,但是“获取字段”按钮无法识别标题


还有其他想法吗?

Get字段将始终查看第一行。您需要手动输入字段列表

如果您在正确的轨道上,将headers设置为2,它将正确读取数据


如果需要解析分隔符声明,则需要解析文件一次以确定其结构,然后使用元数据注入第二次读取数据

谢谢,这就是我所做的。我手动设置字段,并设置2行标题,它就可以工作了。如果这只是为了分隔符,那么我如何解析csv文件来获取元数据呢?不需要,但是如果我可以获取标题,那么这很有趣?一般来说,我对水壶不熟悉。你应该把文件读两遍。第一次读取时,您只关注具有标题的第2行,将其作为单个字段读取,将一些不存在的字符作为分隔符,然后使用已知分隔符将行拆分为行,以获得字段列表。这篇博文解释了一般方法: