Pentaho Pantaho excel将多张工作表输入到一张工作表中
我想将我的excel输入(具有多个工作表)转换为另一个excel输出,但仅具有一个工作表。但在我的输出文件中,不同的数据有一个问题 这是我的输入文件:Pentaho Pantaho excel将多张工作表输入到一张工作表中,pentaho,data-integration,Pentaho,Data Integration,我想将我的excel输入(具有多个工作表)转换为另一个excel输出,但仅具有一个工作表。但在我的输出文件中,不同的数据有一个问题 这是我的输入文件: date data1 data2 data3 01/01/2015 00:00 1,00 9,00 02/01/2015 00:00 2,00 6,00 03/01/2015 00:00 3,00 3,00 04/01/2015 00:00 4,00 2,00
date data1 data2 data3
01/01/2015 00:00 1,00 9,00
02/01/2015 00:00 2,00 6,00
03/01/2015 00:00 3,00 3,00
04/01/2015 00:00 4,00 2,00
05/01/2015 00:00 5,00 5,00
01/01/2015 00:00 2,00
02/01/2015 00:00 3,00
03/01/2015 00:00 6,00
04/01/2015 00:00 9,00
05/01/2015 00:00 8,00
表1
第2张
和输出文件:
date data1 data2 data3
01/01/2015 00:00 1,00 9,00
02/01/2015 00:00 2,00 6,00
03/01/2015 00:00 3,00 3,00
04/01/2015 00:00 4,00 2,00
05/01/2015 00:00 5,00 5,00
01/01/2015 00:00 2,00
02/01/2015 00:00 3,00
03/01/2015 00:00 6,00
04/01/2015 00:00 9,00
05/01/2015 00:00 8,00
但在我的情况下,我希望有以下输出:
date data1 data2 data3
01/01/2015 00:00 1,00 9,00 2,00
02/01/2015 00:00 2,00 6,00 3,00
03/01/2015 00:00 3,00 3,00 6,00
04/01/2015 00:00 4,00 2,00 9,00
05/01/2015 00:00 5,00 5,00 8,00
因此,日期是重复的,drom data3的值在data1的值之后
你能帮我吗,因为我是Pentaho的新手,我不知道如何解决这个问题
谢谢您可以按如下方式操作。
在
microsoftexcelinput
中,获取第一张工作表的数据,microsoftexcelinput 2
获取第二张工作表的数据<代码>合并联接您可以使用从两张图纸中获得的日期字段进行联接。您将获得预期的结果。谢谢您的帮助!
date data1 data2 data3
01/01/2015 00:00 1,00 9,00 2,00
02/01/2015 00:00 2,00 6,00 3,00
03/01/2015 00:00 3,00 3,00 6,00
04/01/2015 00:00 4,00 2,00 9,00
05/01/2015 00:00 5,00 5,00 8,00