Sql server 将多个管道分隔列解析为行,同时保留适当的对齐方式和ID
我被迫使用带有唯一ID和许多列的数据。其中一些列本身包含有关“子”记录的其他详细信息,这些是以管道分隔的字段 我将展示一个修改过的/通用表,其中包含我正在处理的类似管道分隔字段。这里的想法是,列中的每个子项与后续列中的相同子项对齐。即,每个唯一ID的每列中始终有相同数量的子项,但每行可以包含不同数量的子项 虽然我可以使用XML和一些CTE解析数据,但我不相信在原始表中输入值时,值总是会出现在最终查询中,这感觉像是一个黑客而不是一个好的解决方案。特别是考虑到我正在处理的实际表有数千行。我希望有人有一个更优雅的解决方案Sql server 将多个管道分隔列解析为行,同时保留适当的对齐方式和ID,sql-server,tsql,sql-server-2012,Sql Server,Tsql,Sql Server 2012,我被迫使用带有唯一ID和许多列的数据。其中一些列本身包含有关“子”记录的其他详细信息,这些是以管道分隔的字段 我将展示一个修改过的/通用表,其中包含我正在处理的类似管道分隔字段。这里的想法是,列中的每个子项与后续列中的相同子项对齐。即,每个唯一ID的每列中始终有相同数量的子项,但每行可以包含不同数量的子项 虽然我可以使用XML和一些CTE解析数据,但我不相信在原始表中输入值时,值总是会出现在最终查询中,这感觉像是一个黑客而不是一个好的解决方案。特别是考虑到我正在处理的实际表有数千行。我希望有人有
DECLARE @Inputs TABLE
(
ID INT,
Generic1 VARCHAR(50),
Generic2 VARCHAR(50),
Generic3 VARCHAR(50)
)
Insert into @Inputs
VALUES
(1,'yes|no|yes|no','12345.54|34343.34|0|3453.22','a|b|c|d'),
(2,'no|yes','54321.12|12345.12','b|d'),
(3, 'yes|yes|yes','12345.12|78907.32|65432.21','e|f|g|h')
select * from @Inputs
;WITH
cGeneric1 AS (
SELECT
ROW_NUMBER() OVER(partition by ID order by ID) as RowID,
ID,
rtrim(ltrim(n.r.value('.', 'varchar(200)'))) Generic1
FROM
(
SELECT
ID,
Generic1
FROM @Inputs
) as T
CROSS APPLY (select cast('<r>'+replace(Generic1,'|', '</r><r>')+'</r>' as xml)) as S(XMLCol)
CROSS APPLY S.XMLCol.nodes('r') as n(r)),
cGeneric2 AS (
SELECT
ROW_NUMBER() OVER(partition by ID order by ID) as RowID,
ID,
TRY_PARSE(rtrim(ltrim(n.r.value('.', 'varchar(200)'))) as numeric(10,2)) Generic2
FROM
(
SELECT
ID,
Generic2
FROM @Inputs
) as T
CROSS APPLY (select cast('<r>'+replace(Generic2,'|', '</r><r>')+'</r>' as xml)) as S(XMLCol)
CROSS APPLY S.XMLCol.nodes('r') as n(r)),
cGeneric3 AS (
SELECT
ROW_NUMBER() OVER(partition by ID order by ID) as RowID,
ID,
rtrim(ltrim(n.r.value('.', 'varchar(200)'))) Generic3
FROM
(
SELECT
ID,
Generic3
FROM @Inputs
) as T
CROSS APPLY (select cast('<r>'+replace(Generic3,'|', '</r><r>')+'</r>' as xml)) as S(XMLCol)
CROSS APPLY S.XMLCol.nodes('r') as n(r))
SELECT
G1.ID,
G1.Generic1,
G2.Generic2,
G3.Generic3
FROM cGeneric1 G1
INNER JOIN cGeneric2 G2
ON G2.ID=G1.ID
AND G2.RowID=G1.RowID
INNER JOIN cGeneric3 G3
ON G3.ID=G1.ID
AND G3.RowID=G1.RowID
借助于返回序列的parse/split函数 范例 返回 如果感兴趣的话,函数将被删除
如果列总是包含四个或更少的子值,那么可以使用内置的PARSENAME函数。但即使它们可以容纳4个以上,你也可以写下自己的名字 编写一个传递字符串值和整数以及可选的分隔符字符的函数,或者您可以将其硬编码为管道字符。该函数将使用CHARINDEX以分隔符字符的某个匹配项*或字符串的开头开始,然后查找分隔符字符的下一个匹配项或字符串的结尾,并返回这些字符位置之间的子字符串 *函数的整数参数指定了某个引用 最后,如果你像这样调用你的函数:MyFunction'hello | world | peace',1',它将返回字符串世界,假设你使用基于零的逻辑,整数参数…world是第一个管道和第二个管道之间的子字符串 然后可以从列中获取子字符串,并确保在每个函数调用中使用相同的整数值来获取相应的子字符串
我不知道这将有什么样的性能,但它将使代码非常可读,并允许您在更大的查询中内联使用子值。请注意,您的问题并不清楚这是否是您的最终目标。这些列中是否有任何列的子值超过4个分隔符?CLR解决方案是否适合您?@TabAlleman,是的,这是可能的。可能少于7个。@JohnyL,不是。
Declare @YourTable table (ID int,Generic1 varchar(50),Generic2 varchar(50),Generic3 varchar(50))
Insert Into @YourTable values
(1,'Yes|No|Yes|No','12345.54|3443.34|0|3453.22','a|b|c|d'),
(2,'Yes|No','54321.12|12345.12','b|d')
Select A.ID
,B.*
From @YourTable A
Cross Apply (
Select B1.RetSeq
,Generic1 = B1.RetVal
,Generic2 = B2.RetVal
,Generic3 = B3.RetVal
From [dbo].[tvf-Str-Parse](Generic1,'|') B1
Join [dbo].[tvf-Str-Parse](Generic2,'|') B2 on B1.RetSeq=B2.RetSeq
Join [dbo].[tvf-Str-Parse](Generic3,'|') B3 on B1.RetSeq=B3.RetSeq
) B
ID RetSeq Generic1 Generic2 Generic3
1 1 Yes 12345.54 a
1 2 No 3443.34 b
1 3 Yes 0 c
1 4 No 3453.22 d
2 1 Yes 54321.12 b
2 2 No 12345.12 d
CREATE FUNCTION [dbo].[tvf-Str-Parse] (@String varchar(max),@Delimiter varchar(10))
Returns Table
As
Return (
Select RetSeq = Row_Number() over (Order By (Select null))
,RetVal = LTrim(RTrim(B.i.value('(./text())[1]', 'varchar(max)')))
From (Select x = Cast('<x>' + replace((Select replace(@String,@Delimiter,'§§Split§§') as [*] For XML Path('')),'§§Split§§','</x><x>')+'</x>' as xml).query('.')) as A
Cross Apply x.nodes('x') AS B(i)
);