Etl 如何使用pentaho釜从一组行中查找唯一值?

Etl 如何使用pentaho釜从一组行中查找唯一值?,etl,pentaho,kettle,Etl,Pentaho,Kettle,我有一个非标准化的表。我希望从该表的一个特定列中选择所有值,并仅将该列中的唯一值加载到单独的表中 如何使用Pentaho勺子进行此操作?请注意,我完全是个菜鸟。我一生中只尝试过hello world的转变 我有一个名为“Employees”的表,表中有很多列,如下所示(我在这里没有给出不相关的列): 现在,我只想使用Spoon将唯一的分支名称移动到名为branchs的新表中 “分支”表如下所示: +-------------------------------------------------

我有一个非标准化的表。我希望从该表的一个特定列中选择所有值,并仅将该列中的唯一值加载到单独的表中

如何使用Pentaho勺子进行此操作?请注意,我完全是个菜鸟。我一生中只尝试过hello world的转变

我有一个名为“Employees”的表,表中有很多列,如下所示(我在这里没有给出不相关的列):

现在,我只想使用Spoon将唯一的分支名称移动到名为
branchs
的新表中

“分支”表如下所示:

+-------------------------------------------------------+

                           branches
+-------------------------------------------------------+

| branch_id | branch_name 

+-------------------------------------------------------+
其中分支id将是唯一的并自动递增

要连接
员工
分支机构
表,我将使用
员工分支机构
表,该表由
员工编号
分支机构id
列组成

谁能告诉我怎么做


提前谢谢

您不能在sql中这样做吗

从员工中选择不同的授权分支机构

若否,;然后使用“唯一行”步骤(不必对数据进行排序)或“按步骤分组”。(也分类)

或;如果行数较低,则按内存分组(数据不需要排序)

+-------------------------------------------------------+

                           branches
+-------------------------------------------------------+

| branch_id | branch_name 

+-------------------------------------------------------+