Sql SSIS对组数据进行模糊分组,以生成唯一的组Id值
需要根据来自同一表的多个列值的组合分配唯一的组Id。值有时是唯一的 任何形式的SQL、SSIS、DQS都适用于以下请求。已尝试DQ,但未到达目的地。表中有大约200多万行 例如,名字、姓氏和电子邮件地址值匹配,但电话号码不同。一切都匹配,但customerId可能不同 以下是样本数据。最后一列中名为finalgroupid的最终输出 请帮忙。提前感谢。您可以根据需要使用 这里有一个例子Sql SSIS对组数据进行模糊分组,以生成唯一的组Id值,sql,sql-server,ssis,fuzzy-logic,Sql,Sql Server,Ssis,Fuzzy Logic,需要根据来自同一表的多个列值的组合分配唯一的组Id。值有时是唯一的 任何形式的SQL、SSIS、DQS都适用于以下请求。已尝试DQ,但未到达目的地。表中有大约200多万行 例如,名字、姓氏和电子邮件地址值匹配,但电话号码不同。一切都匹配,但customerId可能不同 以下是样本数据。最后一列中名为finalgroupid的最终输出 请帮忙。提前感谢。您可以根据需要使用 这里有一个例子 select groupno = DENSE_RANK() over (order by col1,
select
groupno = DENSE_RANK() over (order by col1, col2), *
from myTable
你的匹配逻辑不清楚。请解释如何对数据进行分组。首先尝试匹配LastName和FirstName,然后匹配电话,然后匹配电子邮件,然后匹配地址和客户ID。同样,逻辑是什么?如果matach LastName和FirstName有一个组ID?LastName和FirstName匹配给出一个临时组ID 1,然后匹配电话,给出临时组ID 2,然后匹配电子邮件,给出临时组ID 3,然后匹配地址,给出临时组ID 4,然后匹配CustomerId,并根据所有这些组ID给出临时组ID。确定这是一个单一客户,并为该客户提供唯一的组ID。您仍然没有提供逻辑。请阅读和
select
groupno = DENSE_RANK() over (order by col1, col2), *
from myTable