Etl 如何使用pentaho釜从一组行中查找唯一值?
我有一个非标准化的表。我希望从该表的一个特定列中选择所有值,并仅将该列中的唯一值加载到单独的表中 如何使用Pentaho勺子进行此操作?请注意,我完全是个菜鸟。我一生中只尝试过hello world的转变 我有一个名为“Employees”的表,表中有很多列,如下所示(我在这里没有给出不相关的列): 现在,我只想使用Spoon将唯一的分支名称移动到名为Etl 如何使用pentaho釜从一组行中查找唯一值?,etl,pentaho,kettle,Etl,Pentaho,Kettle,我有一个非标准化的表。我希望从该表的一个特定列中选择所有值,并仅将该列中的唯一值加载到单独的表中 如何使用Pentaho勺子进行此操作?请注意,我完全是个菜鸟。我一生中只尝试过hello world的转变 我有一个名为“Employees”的表,表中有很多列,如下所示(我在这里没有给出不相关的列): 现在,我只想使用Spoon将唯一的分支名称移动到名为branchs的新表中 “分支”表如下所示: +-------------------------------------------------
branchs
的新表中
“分支”表如下所示:
+-------------------------------------------------------+
branches
+-------------------------------------------------------+
| branch_id | branch_name
+-------------------------------------------------------+
其中分支id将是唯一的并自动递增
要连接员工
和分支机构
表,我将使用员工分支机构
表,该表由员工编号
和分支机构id
列组成
谁能告诉我怎么做
提前谢谢 您不能在sql中这样做吗 从员工中选择不同的授权分支机构 若否,;然后使用“唯一行”步骤(不必对数据进行排序)或“按步骤分组”。(也分类) 或;如果行数较低,则按内存分组(数据不需要排序)
+-------------------------------------------------------+
branches
+-------------------------------------------------------+
| branch_id | branch_name
+-------------------------------------------------------+