如何通过Talend数据准备消除重复?

如何通过Talend数据准备消除重复?,talend,Talend,我想通过我的Talend数据准备删除重复,我有一个名为:HOURS的列,我想计算它们之间的小时数,并删除电子邮件和名称重复,下面是我的表格示例: 正如您所看到的,我有很多用户名和电子邮件是相同的,但我的工作时间不一样,我想根据用户名和电子邮件将我的工作时间加在一起,同时删除我用户名和电子邮件的任何重复项。(我并不真正喜欢数据准备,所以可能有一个我不知道的内部解决方案) 我认为,在Talend数据准备中,不能使用带有求和操作的GROUP BY,因为该工具只能更正数据行,不能进行聚合操作 从dat

我想通过我的Talend数据准备删除重复,我有一个名为:HOURS的列,我想计算它们之间的小时数,并删除电子邮件和名称重复,下面是我的表格示例:

正如您所看到的,我有很多用户名和电子邮件是相同的,但我的工作时间不一样,我想根据用户名和电子邮件将我的工作时间加在一起,同时删除我用户名和电子邮件的任何重复项。

(我并不真正喜欢数据准备,所以可能有一个我不知道的内部解决方案)

我认为,在Talend数据准备中,不能使用带有求和操作的GROUP BY,因为该工具只能更正数据行,不能进行聚合操作

从data Prep导出更正后的数据后,您将能够在Talend data Integration中使用tAggregateRow对数据求和