Rows 在Talend中具有指定内容的列之间标记数据
我有以下格式的某些数据: 起始数据 印度| 23 | 8.001 | 12/09/2013 英国| 22 | 4.001 | 12/10/2013 美国| 13 | 4.001 | 12/08/2013 结束数据 起始数据 亚洲| 123 | 8.001 | 22/09/2013 E | 22 | 4.001 | 12/10/2013 美国| 13 | 4.001 | 15/08/2013 结束数据 文件中第一个开始数据和最后一个结束数据之前可以有任意“n”行数。我想忽略这些行,只取第一个开始数据和最后一个结束数据之间的行。我怎么得到它Rows 在Talend中具有指定内容的列之间标记数据,rows,talend,Rows,Talend,我有以下格式的某些数据: 起始数据 印度| 23 | 8.001 | 12/09/2013 英国| 22 | 4.001 | 12/10/2013 美国| 13 | 4.001 | 12/08/2013 结束数据 起始数据 亚洲| 123 | 8.001 | 22/09/2013 E | 22 | 4.001 | 12/10/2013 美国| 13 | 4.001 | 15/08/2013 结束数据 文件中第一个开始数据和最后一个结束数据之前可以有任意“n”行数。我想忽略这些行,只取第一个开始数
我正在尝试使用tStandardizeRow实现它。考虑到管道是这里的分隔符,除了开始数据和结束数据之外,所有其他行的列数都是一致的……然后您可以执行如下操作 tFileInputDelimited->tfilterRow-.Finaloutput/dboutput组件,您要在其中插入/处理数据 在tFileInputDelimited模式中,我将如下定义它 第1列、第2列、第3列、第4列…delimeter |和行尾by\n 现在在tFilterRow中,我将应用过滤条件,因为column1不等于开始数据和结束数据 在高级别,我们读取所有行,但随后使用tfilterrow进行过滤。由于我们使用了行的结尾,所以您的结束数据和开始数据将被读取,但作为这些行的第1列值。。。
您还必须为所有列允许nullable…这将只获取开始数据和结束数据行,而不是实际数据。不确定..因为它应该理想地读取上述示例中的所有10行,并且这4行中的column1值将作为开始数据和结束数据,并将被筛选器阻止…我建议读取使用输入组件将文件作为输入分隔文件,然后在talend中筛选行。我在这里假设开始数据和结束数据是文件中的实际行,数据文本作为开始数据和结束数据。。