Excel 两列的值不是100%相等的内部联接

Excel 两列的值不是100%相等的内部联接,excel,ssis,inner-join,Excel,Ssis,Inner Join,我有两个excel文件,一个有两列(ID1,名称),另一个有两列(ID2,名称),我需要导出一个有三列(ID1,ID2,名称)的文件 问题是每个文件中都有名字,而另一个文件中没有名字,更大的问题是,在两个文件中写相同的名字有一些差异,这是文件语言的共同差异,比如阿拉伯语中的字符“أ”可以不用Hamza“ا”来写(我的意思是,我不能使用两个字符串之间的标准相等操作来指定一个文件中的名称与另一个文件中的名称相同) 我的问题是,是否有任何工具可以帮助我,而无需为其编写代码,我听说过SQL Integr

我有两个excel文件,一个有两列(ID1,名称),另一个有两列(ID2,名称),我需要导出一个有三列(ID1,ID2,名称)的文件

问题是每个文件中都有名字,而另一个文件中没有名字,更大的问题是,在两个文件中写相同的名字有一些差异,这是文件语言的共同差异,比如阿拉伯语中的字符“أ”可以不用Hamza“ا”来写(我的意思是,我不能使用两个字符串之间的标准相等操作来指定一个文件中的名称与另一个文件中的名称相同)

我的问题是,是否有任何工具可以帮助我,而无需为其编写代码,我听说过SQL Integration Services,但我对此一无所知,请您为我指出任何有助于解决我的问题的参考资料

任何链接、建议或其他帮助都将不胜感激


非常感谢您有一个有趣的问题,但不幸的是,在这种情况下,有趣=困难。对于英文类型的名称,我们可以使用多种名称匹配算法(双变音、最小编辑距离、Damerau–Levenshtein距离等)但我不知道这些语言在像阿拉伯语这样的丰富语言中能起到多大的作用


尝试SSIS:and的模糊功能不会有什么坏处。在您的情况下,模糊分组是您想要尝试的。这些是企业版功能,因此从许可的角度来看,请注意这一点。它们在您的开发版中可以正常工作,但如果您部署并尝试在标准版SQL Server上运行,它将失败。

感谢您的快速回复和您指出的详细答案,我将暂时不回答这个问题,以获得其他答案。