Ssis 新的模糊查找

Ssis 新的模糊查找,ssis,Ssis,我是SSIS模糊组设施的新手。假设我有一百万条记录,我想每天清理一次。其中一些记录可能会更改,例如姓氏或出生日期不正确。此外,每天都会创建新记录。我有两个问题: 每次运行SSIS包时,输出表(包含:key_out和key_in的表)是被截断的,还是与上次运行时相比保持不变 如果它保持不变,那么有没有办法只匹配新记录以节省时间?如果只输入新记录,那么之前匹配的所有记录是否都保留在一起匹配的输出表中,还是丢失了它们 对问题2的答复: 您可以使用查找转换 •“如果引用数据集中没有匹配项,则不会发生联接

我是SSIS模糊组设施的新手。假设我有一百万条记录,我想每天清理一次。其中一些记录可能会更改,例如姓氏或出生日期不正确。此外,每天都会创建新记录。我有两个问题:

  • 每次运行SSIS包时,输出表(包含:key_out和key_in的表)是被截断的,还是与上次运行时相比保持不变
  • 如果它保持不变,那么有没有办法只匹配新记录以节省时间?如果只输入新记录,那么之前匹配的所有记录是否都保留在一起匹配的输出表中,还是丢失了它们
  • 对问题2的答复:


    您可以使用
    查找转换

    •“如果引用数据集中没有匹配项,则不会发生联接。默认情况下,查找转换将没有匹配项的行视为错误。但是,您可以配置查找转换以将这些行重定向到不匹配的输出。有关更多信息,请参阅查找转换编辑器(常规页)和查找转换编辑器(错误输出页)。”

    •如果引用表中有多个匹配项,则查找转换仅返回查找查询返回的第一个匹配项。如果找到多个匹配项,则仅当转换配置为将所有引用数据集加载到缓存中时,查找转换才会生成错误或警告。在这种情况下,当转换在缓存中填充时检测到多个匹配项时,查找转换将生成警告。”


    您可以使用
    查找转换来回答问题2:@Jeff Orris,谢谢。“最大匹配数”的典型值是多少?我想这个值是无限的?您可以发布一个答案作为您的评论来回答我的问题吗?您的评论的更新答案在我留下的答案中…顺便说一句,
    Fuzzy查找转换
    也一样谢谢。您有什么值:“最大匹配数?”“。我希望这是无限的。@w0051977我一直在搜索你,但无法定义一个确定的答案。”。我会假设无限,因为在MSDN中没有状态…只要在匹配发生和缓存被填充后状态,然后生成异常。