Sql server SSIS平面文件源代码-消除一些嵌入的不需要的双引号
我引用了几个与此问题相关的线程,但还没有找到合适的解决方案。所以只要问这个问题——在使用SSIS数据流加载到sql数据库之前,有没有办法自动删除csv文本分隔文件中不需要的双引号。我正在使用平面文件连接管理器,如下所示: 请参见示例数据:Sql server SSIS平面文件源代码-消除一些嵌入的不需要的双引号,sql-server,ssis,ssas,etl,business-intelligence,Sql Server,Ssis,Ssas,Etl,Business Intelligence,我引用了几个与此问题相关的线程,但还没有找到合适的解决方案。所以只要问这个问题——在使用SSIS数据流加载到sql数据库之前,有没有办法自动删除csv文本分隔文件中不需要的双引号。我正在使用平面文件连接管理器,如下所示: 请参见示例数据: "FirstName","LastName","Target" "Jim","Tunsh","20 \ HC" "Tim&quo
"FirstName","LastName","Target"
"Jim","Tunsh","20 \ HC"
"Tim","Harkin"","40 \" HC"
"George","Washington","30 \ HC"
您可以看到在斜杠后的第二行有一个不需要的双引号。我正试着用一个空的空间或什么来代替它
我尝试了使用正则表达式的派生列,如下所示:
LTRIM(RTRIM(REPLACE([Target],"\" ","")))
似乎不起作用
如果您有更好的想法,请与我们分享。可能不是一个很好的解决方案,但是这个问题可以通过删除该字段中的所有双引号来解决。 为此,添加了一个派生列,并编写了一个表达式来删除所需列的引号并替换该列
REPLACE([Target],"\"","")
可能不是一个很好的解决方案,但是这个问题可以通过删除该字段中的所有双引号来解决。 为此,添加了一个派生列,并编写了一个表达式来删除所需列的引号并替换该列
REPLACE([Target],"\"","")
CSV数据
“40\“HC”
编码不正确。根据它的编码应该是“40\”“HC”
(请注意反斜杠后面的额外“
字符)。该文件在“Harkin”中还有一个错误的额外引号“
。谢谢!对从技术上讲,该文件的格式是错误的。但数据工厂模块就是这样生成的。可以在数据条目中更正名称周围的额外引号CSV数据“40\“HC”
编码不正确。根据它的说明,应该是“40\”“HC”
(注意反斜杠后面的额外“
字符)。该文件在“Harkin”中还有一个错误的额外引号“
。谢谢!对从技术上讲,该文件的格式是错误的。但数据工厂模块就是这样生成的。可以在数据输入中更正名称周围的额外引号