Sql server 将多个管道分隔列解析为行，同时保留适当的对齐方式和ID_Sql Server_Tsql_Sql Server 2012

Sql server 将多个管道分隔列解析为行，同时保留适当的对齐方式和ID

sql-server tsql sql-server-2012

Sql server 将多个管道分隔列解析为行，同时保留适当的对齐方式和ID,sql-server,tsql,sql-server-2012,Sql Server,Tsql,Sql Server 2012,我被迫使用带有唯一ID和许多列的数据。其中一些列本身包含有关“子”记录的其他详细信息，这些是以管道分隔的字段我将展示一个修改过的/通用表，其中包含我正在处理的类似管道分隔字段。这里的想法是，列中的每个子项与后续列中的相同子项对齐。即，每个唯一ID的每列中始终有相同数量的子项，但每行可以包含不同数量的子项虽然我可以使用XML和一些CTE解析数据，但我不相信在原始表中输入值时，值总是会出现在最终查询中，这感觉像是一个黑客而不是一个好的解决方案。特别是考虑到我正在处理的实际表有数千行。我希望有人有

我被迫使用带有唯一ID和许多列的数据。其中一些列本身包含有关“子”记录的其他详细信息，这些是以管道分隔的字段

我将展示一个修改过的/通用表，其中包含我正在处理的类似管道分隔字段。这里的想法是，列中的每个子项与后续列中的相同子项对齐。即，每个唯一ID的每列中始终有相同数量的子项，但每行可以包含不同数量的子项

虽然我可以使用XML和一些CTE解析数据，但我不相信在原始表中输入值时，值总是会出现在最终查询中，这感觉像是一个黑客而不是一个好的解决方案。特别是考虑到我正在处理的实际表有数千行。我希望有人有一个更优雅的解决方案

DECLARE @Inputs TABLE
(
    ID INT,
    Generic1 VARCHAR(50),
    Generic2 VARCHAR(50),
    Generic3 VARCHAR(50)
)

Insert into @Inputs
VALUES
(1,'yes|no|yes|no','12345.54|34343.34|0|3453.22','a|b|c|d'),
(2,'no|yes','54321.12|12345.12','b|d'),
(3, 'yes|yes|yes','12345.12|78907.32|65432.21','e|f|g|h')

select * from @Inputs

;WITH
cGeneric1 AS (
SELECT 
        ROW_NUMBER() OVER(partition by ID order by ID) as RowID, 
        ID, 
        rtrim(ltrim(n.r.value('.', 'varchar(200)'))) Generic1
    FROM 
        (
        SELECT 
            ID,
            Generic1
        FROM @Inputs
        ) as T
      CROSS APPLY (select cast('<r>'+replace(Generic1,'|', '</r><r>')+'</r>' as xml)) as S(XMLCol)
      CROSS APPLY S.XMLCol.nodes('r') as n(r)),

cGeneric2 AS (
SELECT 
        ROW_NUMBER() OVER(partition by ID order by ID) as RowID, 
        ID, 
        TRY_PARSE(rtrim(ltrim(n.r.value('.', 'varchar(200)'))) as numeric(10,2)) Generic2
    FROM 
        (
        SELECT 
            ID,
            Generic2
        FROM @Inputs
        ) as T
      CROSS APPLY (select cast('<r>'+replace(Generic2,'|', '</r><r>')+'</r>' as xml)) as S(XMLCol)
      CROSS APPLY S.XMLCol.nodes('r') as n(r)),

cGeneric3 AS (
SELECT 
        ROW_NUMBER() OVER(partition by ID order by ID) as RowID, 
        ID, 
        rtrim(ltrim(n.r.value('.', 'varchar(200)'))) Generic3
    FROM 
        (
        SELECT 
            ID,
            Generic3
        FROM @Inputs
        ) as T
      CROSS APPLY (select cast('<r>'+replace(Generic3,'|', '</r><r>')+'</r>' as xml)) as S(XMLCol)
      CROSS APPLY S.XMLCol.nodes('r') as n(r))



SELECT
    G1.ID,
    G1.Generic1,
    G2.Generic2,
    G3.Generic3
FROM cGeneric1 G1
  INNER JOIN cGeneric2 G2
    ON G2.ID=G1.ID
      AND G2.RowID=G1.RowID
  INNER JOIN cGeneric3 G3
    ON G3.ID=G1.ID
      AND G3.RowID=G1.RowID

借助于返回序列的parse/split函数

范例

如果感兴趣的话，函数将被删除

如果列总是包含四个或更少的子值，那么可以使用内置的PARSENAME函数。但即使它们可以容纳4个以上，你也可以写下自己的名字

编写一个传递字符串值和整数以及可选的分隔符字符的函数，或者您可以将其硬编码为管道字符。该函数将使用CHARINDEX以分隔符字符的某个匹配项*或字符串的开头开始，然后查找分隔符字符的下一个匹配项或字符串的结尾，并返回这些字符位置之间的子字符串

*函数的整数参数指定了某个引用

最后，如果你像这样调用你的函数：MyFunction'hello | world | peace'，1'，它将返回字符串世界，假设你使用基于零的逻辑，整数参数…world是第一个管道和第二个管道之间的子字符串

然后可以从列中获取子字符串，并确保在每个函数调用中使用相同的整数值来获取相应的子字符串

我不知道这将有什么样的性能，但它将使代码非常可读，并允许您在更大的查询中内联使用子值。请注意，您的问题并不清楚这是否是您的最终目标。

这些列中是否有任何列的子值超过4个分隔符？CLR解决方案是否适合您？@TabAlleman，是的，这是可能的。可能少于7个。@JohnyL，不是。

Declare @YourTable table (ID int,Generic1 varchar(50),Generic2 varchar(50),Generic3 varchar(50))
Insert Into @YourTable values
(1,'Yes|No|Yes|No','12345.54|3443.34|0|3453.22','a|b|c|d'),
(2,'Yes|No','54321.12|12345.12','b|d')


Select A.ID 
      ,B.*
 From  @YourTable A
 Cross Apply (
                Select B1.RetSeq
                      ,Generic1 = B1.RetVal
                      ,Generic2 = B2.RetVal
                      ,Generic3 = B3.RetVal
                  From [dbo].[tvf-Str-Parse](Generic1,'|') B1
                  Join [dbo].[tvf-Str-Parse](Generic2,'|') B2 on B1.RetSeq=B2.RetSeq
                  Join [dbo].[tvf-Str-Parse](Generic3,'|') B3 on B1.RetSeq=B3.RetSeq
             ) B

ID  RetSeq  Generic1    Generic2    Generic3
1   1       Yes         12345.54    a
1   2       No          3443.34     b
1   3       Yes         0           c
1   4       No          3453.22     d
2   1       Yes         54321.12    b
2   2       No          12345.12    d

CREATE FUNCTION [dbo].[tvf-Str-Parse] (@String varchar(max),@Delimiter varchar(10))
Returns Table 
As
Return (  
    Select RetSeq = Row_Number() over (Order By (Select null))
          ,RetVal = LTrim(RTrim(B.i.value('(./text())[1]', 'varchar(max)')))
    From  (Select x = Cast('<x>' + replace((Select replace(@String,@Delimiter,'§§Split§§') as [*] For XML Path('')),'§§Split§§','</x><x>')+'</x>' as xml).query('.')) as A 
    Cross Apply x.nodes('x') AS B(i)
);