如何在SQL Server中使用GROUP BY连接字符串?

如何在SQL Server中使用GROUP BY连接字符串?,sql,sql-server,string-concatenation,sql-server-group-concat,Sql,Sql Server,String Concatenation,Sql Server Group Concat,如何获得: id Name Value 1 A 4 1 B 8 2 C 9 到 这种问题在这里经常被问到,解决方案将在很大程度上取决于基本需求: 及 通常,如果没有动态SQL、用户定义函数或游标,就没有唯一的SQL方法来实现这一点。只是补充Cade所说的,这通常是前端显示,因此应该在那里处理。我知道有时候100%用SQL编写文件导出或其他纯SQL解决方案更容易,但

如何获得:

id       Name       Value
1          A          4
1          B          8
2          C          9


这种问题在这里经常被问到,解决方案将在很大程度上取决于基本需求:


通常,如果没有动态SQL、用户定义函数或游标,就没有唯一的SQL方法来实现这一点。

只是补充Cade所说的,这通常是前端显示,因此应该在那里处理。我知道有时候100%用SQL编写文件导出或其他纯SQL解决方案更容易,但大多数情况下,这种连接应该在显示层中处理。

不需要光标。。。一个while循环就足够了

------------------------------
-- Setup
------------------------------

DECLARE @Source TABLE
(
  id int,
  Name varchar(30),
  Value int
)

DECLARE @Target TABLE
(
  id int,
  Result varchar(max) 
)


INSERT INTO @Source(id, Name, Value) SELECT 1, 'A', 4
INSERT INTO @Source(id, Name, Value) SELECT 1, 'B', 8
INSERT INTO @Source(id, Name, Value) SELECT 2, 'C', 9


------------------------------
-- Technique
------------------------------

INSERT INTO @Target (id)
SELECT id
FROM @Source
GROUP BY id

DECLARE @id int, @Result varchar(max)
SET @id = (SELECT MIN(id) FROM @Target)

WHILE @id is not null
BEGIN
  SET @Result = null

  SELECT @Result =
    CASE
      WHEN @Result is null
      THEN ''
      ELSE @Result + ', '
    END + s.Name + ':' + convert(varchar(30),s.Value)
  FROM @Source s
  WHERE id = @id

  UPDATE @Target
  SET Result = @Result
  WHERE id = @id

  SET @id = (SELECT MIN(id) FROM @Target WHERE @id < id)
END

SELECT *
FROM @Target
不需要游标、WHILE循环或用户定义的函数

只需要对XML和PATH进行创新

[注意:此解决方案仅适用于SQL 2005及更高版本。原始问题未指定正在使用的版本。]

CREATE TABLE #YourTable ([ID] INT, [Name] CHAR(1), [Value] INT)

INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (1,'A',4)
INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (1,'B',8)
INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (2,'C',9)

SELECT 
  [ID],
  STUFF((
    SELECT ', ' + [Name] + ':' + CAST([Value] AS VARCHAR(MAX)) 
    FROM #YourTable 
    WHERE (ID = Results.ID) 
    FOR XML PATH(''),TYPE).value('(./text())[1]','VARCHAR(MAX)')
  ,1,2,'') AS NameValues
FROM #YourTable Results
GROUP BY ID

DROP TABLE #YourTable

SQL Server 2005及更高版本允许您创建自己的,包括连接之类的内容-请参阅链接文章底部的示例。

使用SQL Server 2005及更高版本的另一个选项

---- test data
declare @t table (OUTPUTID int, SCHME varchar(10), DESCR varchar(10))
insert @t select 1125439       ,'CKT','Approved'
insert @t select 1125439       ,'RENO','Approved'
insert @t select 1134691       ,'CKT','Approved'
insert @t select 1134691       ,'RENO','Approved'
insert @t select 1134691       ,'pn','Approved'

---- actual query
;with cte(outputid,combined,rn)
as
(
  select outputid, SCHME + ' ('+DESCR+')', rn=ROW_NUMBER() over (PARTITION by outputid order by schme, descr)
  from @t
)
,cte2(outputid,finalstatus,rn)
as
(
select OUTPUTID, convert(varchar(max),combined), 1 from cte where rn=1
union all
select cte2.outputid, convert(varchar(max),cte2.finalstatus+', '+cte.combined), cte2.rn+1
from cte2
inner join cte on cte.OUTPUTID = cte2.outputid and cte.rn=cte2.rn+1
)
select outputid, MAX(finalstatus) from cte2 group by outputid

顺便说一句,这只是凯文·费尔奇尔德文章的补充,非常聪明。我本想将其作为评论添加,但我还没有足够的观点:

我使用这个想法来创建一个视图,但是我创建的项目包含空格。所以我稍微修改了代码,不使用空格作为分隔符

再次感谢凯文的冷静解决方案

CREATE TABLE #YourTable ( [ID] INT, [Name] CHAR(1), [Value] INT ) 

INSERT INTO #YourTable ([ID], [Name], [Value]) VALUES (1, 'A', 4) 
INSERT INTO #YourTable ([ID], [Name], [Value]) VALUES (1, 'B', 8) 
INSERT INTO #YourTable ([ID], [Name], [Value]) VALUES (2, 'C', 9) 

SELECT [ID], 
       REPLACE(REPLACE(REPLACE(
                          (SELECT [Name] + ':' + CAST([Value] AS VARCHAR(MAX)) as A 
                           FROM   #YourTable 
                           WHERE  ( ID = Results.ID ) 
                           FOR XML PATH (''))
                        , '</A><A>', ', ')
                ,'<A>','')
        ,'</A>','') AS NameValues 
FROM   #YourTable Results 
GROUP  BY ID 

DROP TABLE #YourTable 

当我尝试将Kevin Fairchild的建议转换为包含空格和特殊XML字符的字符串时,遇到了几个问题,这些字符串是经过编码的

我的代码的最终版本没有回答原始问题,但可能对某些人有用,如下所示:

CREATE TABLE #YourTable ([ID] INT, [Name] VARCHAR(MAX), [Value] INT)

INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (1,'Oranges & Lemons',4)
INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (1,'1 < 2',8)
INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (2,'C',9)

SELECT  [ID],
  STUFF((
    SELECT ', ' + CAST([Name] AS VARCHAR(MAX))
    FROM #YourTable WHERE (ID = Results.ID) 
    FOR XML PATH(''),TYPE 
     /* Use .value to uncomment XML entities e.g. &gt; &lt; etc*/
    ).value('.','VARCHAR(MAX)') 
  ,1,2,'') as NameValues
FROM    #YourTable Results
GROUP BY ID

DROP TABLE #YourTable
它不使用空格作为分隔符并用逗号替换所有空格,而是对每个值预先挂起一个逗号和空格,然后使用STUFF删除前两个字符


XML编码是通过使用指令自动处理的。

使用XML路径将不会像您预期的那样完美地连接。。。它将取代&;也会弄乱 …也许还有其他一些事情,不确定…但你可以试试这个

我找到了一个解决办法。。。您需要替换:

FOR XML PATH('')
)
与:

…或NVARCHARMAX,如果您正在使用

为什么SQL没有连接聚合函数?这是一个PITA。

例如 在Oracle中,可以使用LISTAGG聚合函数

原始记录

Sql

导致

让我们变得非常简单:

SELECT stuff(
    (
    select ', ' + x from (SELECT 'xxx' x union select 'yyyy') tb 
    FOR XML PATH('')
    )
, 1, 2, '')
替换此行:

select ', ' + x from (SELECT 'xxx' x union select 'yyyy') tb

使用您的查询。

如果group by主要包含一项,则可以通过以下方式显著提高性能:

SELECT 
  [ID],

CASE WHEN MAX( [Name]) = MIN( [Name]) THEN 
MAX( [Name]) NameValues
ELSE

  STUFF((
    SELECT ', ' + [Name] + ':' + CAST([Value] AS VARCHAR(MAX)) 
    FROM #YourTable 
    WHERE (ID = Results.ID) 
    FOR XML PATH(''),TYPE).value('(./text())[1]','VARCHAR(MAX)')
  ,1,2,'') AS NameValues

END

FROM #YourTable Results
GROUP BY ID

从安装SQLCLR聚合

然后,您可以编写如下代码以获得所需的结果:

CREATE TABLE foo
(
 id INT,
 name CHAR(1),
 Value CHAR(1)
);

INSERT  INTO dbo.foo
    (id, name, Value)
VALUES  (1, 'A', '4'),
        (1, 'B', '8'),
        (2, 'C', '9');

SELECT  id,
    dbo.GROUP_CONCAT(name + ':' + Value) AS [Column]
FROM    dbo.foo
GROUP BY id;

八年后。。。Microsoft SQL Server vNext数据库引擎最终增强了Transact-SQL以直接支持分组字符串连接。社区技术预览版本1.0添加了STRING_AGG函数,CTP 1.1为STRING_AGG函数添加了in-GROUP子句


参考:

没有看到任何交叉应用答案,也不需要提取xml。下面是凯文·费尔奇尔德(Kevin Fairchild)所写内容的一个稍微不同的版本。在更复杂的查询中使用它更快、更容易:

   select T.ID
,MAX(X.cl) NameValues
 from #YourTable T
 CROSS APPLY 
 (select STUFF((
    SELECT ', ' + [Name] + ':' + CAST([Value] AS VARCHAR(MAX))
    FROM #YourTable 
    WHERE (ID = T.ID) 
    FOR XML PATH(''))
  ,1,2,'')  [cl]) X
  GROUP BY T.ID

如果是SQL Server 2017或SQL Server Vnext、SQL Azure,则您可以使用字符串_agg,如下所示:

select id, string_agg(concat(name, ':', [value]), ', ')
from #YourTable 
group by id

使用Replace函数和FOR JSON路径

SELECT T3.DEPT, REPLACE(REPLACE(T3.ENAME,'{"ENAME":"',''),'"}','') AS ENAME_LIST
FROM (
 SELECT DEPT, (SELECT ENAME AS [ENAME]
        FROM EMPLOYEE T2
        WHERE T2.DEPT=T1.DEPT
        FOR JSON PATH,WITHOUT_ARRAY_WRAPPER) ENAME
    FROM EMPLOYEE T1
    GROUP BY DEPT) T3

对于示例数据和其他方式

如果启用了clr,则可以使用GitHub中的库

另一个没有垃圾的示例:,键入.value'./text[1]',VARCHARMAX'

WITH t AS (
    SELECT 1 n, 1 g, 1 v
    UNION ALL 
    SELECT 2 n, 1 g, 2 v
    UNION ALL 
    SELECT 3 n, 2 g, 3 v
)
SELECT g
        , STUFF (
                (
                    SELECT ', ' + CAST(v AS VARCHAR(MAX))
                    FROM t sub_t
                    WHERE sub_t.g = main_t.g
                    FOR XML PATH('')
                )
                , 1, 2, ''
        ) cg
FROM t main_t
GROUP BY g
输入输出为

*************************   ->  *********************
*   n   *   g   *   v   *       *   g   *   cg      *
*   -   *   -   *   -   *       *   -   *   -       *
*   1   *   1   *   1   *       *   1   *   1, 2    *
*   2   *   1   *   2   *       *   2   *   3       *
*   3   *   2   *   3   *       *********************
*************************   

使用Stuff和for xml path操作符将行连接到string:Group By two columns->

CREATE TABLE #YourTable ([ID] INT, [Name] CHAR(1), [Value] INT)

INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (1,'A',4)
INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (1,'B',8)
INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (1,'B',5)
INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (2,'C',9)

-- retrieve each unique id and name columns and concatonate the values into one column
SELECT 
  [ID], 
  STUFF((
    SELECT ', ' + [Name] + ':' + CAST([Value] AS VARCHAR(MAX)) -- CONCATONATES EACH APPLICATION : VALUE SET      
    FROM #YourTable 
    WHERE (ID = Results.ID and Name = results.[name] ) 
    FOR XML PATH(''),TYPE).value('(./text())[1]','VARCHAR(MAX)')
  ,1,2,'') AS NameValues
FROM #YourTable Results
GROUP BY ID


SELECT 
  [ID],[Name] , --these are acting as the group by clause
  STUFF((
    SELECT ', '+  CAST([Value] AS VARCHAR(MAX)) -- CONCATONATES THE VALUES FOR EACH ID NAME COMBINATION 
    FROM #YourTable 
    WHERE (ID = Results.ID and Name = results.[name] ) 
    FOR XML PATH(''),TYPE).value('(./text())[1]','VARCHAR(MAX)')
  ,1,2,'') AS  NameValues
FROM #YourTable Results
GROUP BY ID, name

DROP TABLE #YourTable

我使用了这种可能更容易掌握的方法。获取根元素,然后选择具有相同ID但不是“官方”名称的任何项

  Declare @IdxList as Table(id int, choices varchar(max),AisName varchar(255))
  Insert into @IdxLIst(id,choices,AisName)
  Select IdxId,''''+Max(Title)+'''',Max(Title) From [dbo].[dta_Alias] 
 where IdxId is not null group by IdxId
  Update @IdxLIst
    set choices=choices +','''+Title+''''
    From @IdxLIst JOIN [dta_Alias] ON id=IdxId And Title <> AisName
    where IdxId is not null
    Select * from @IdxList where choices like '%,%'

对于我所有的医护人员:

选择 s、 附注 东西 选择 [注(正文)]+'' 从…起 HNO_注释_文本s1 哪里 s1.注释ID=s.注释ID 按[行]ASC订购 对于XML路径,键入.value'/text[1]',VARCHARMAX' , 1. 2. 如注释所示 从…起 HNO_注释_文本s 按注释分组\u ID
为什么一个人不锁定临时表?这是我一生中见过的最酷的SQL。知道大型数据集的速度是否快吗?它不会像光标一样开始爬行,是吗?我希望更多的人会投票支持这种疯狂行为。我只是讨厌它的子查询风格。连接好得多。只是不认为我可以在这个解决方案中利用它。不管怎样,我很高兴看到除了我之外还有其他SQL呆子喜欢学习这样的东西。荣誉

给大家:一种稍微干净一点的字符串操作方法:STUFFSELECT'、'+[Name]+':'+CAST[Value]作为VARCHARMAX从您的表中进行转换,其中ID=Results.ID代表XML路径1,2,作为NameValues必须注意我发现的一些东西。即使在不区分大小写的环境中,查询的.value部分也需要小写。我猜这是因为它是XML,区分大小写。不幸的是,这需要使用CLR程序集。。这是要处理的另一个问题:-/仅示例使用CLR进行实际的连接实现,但这不是必需的。您可以将连接聚合函数用于XML,这样至少将来调用它会更简洁!这种类型的问题在MySQL上很容易解决,因为MySQL具有GROUP_CONCAT聚合函数,但在Microsoft SQL Server上解决它更难。请参见以下SO问题以获取帮助:拥有microsoft帐户的每个人都应该投票选择一个更简单的连接解决方案:在T-SQL得到增强之前,您可以使用此处找到的SQLCLR聚合作为替代:复制的看起来不错,但问题并不是关于Oracle的。我理解。但我也在为甲骨文寻找同样的东西,所以我想我会把它放在这里给像我这样的人:@MichalB。您是否缺少内部语法?e、 g:listaggtype,“,”在grouporder中按名称排列?@gregory:我编辑了我的答案。我想我以前的解决方案在过去很管用。你建议的当前形式肯定会奏效,谢谢。对于未来的人们,你可以用你自己的答案写一个新问题,比如不同的平台。我已经搜索了网络,寻找不编码输出的最佳方式。非常感谢你!这是一个明确的答案——直到MS为其添加了适当的支持,比如CONCAT聚合函数。我要做的是将其放入一个外部应用程序中,该应用程序返回我的连接字段。我不喜欢在select语句中添加嵌套的select。我同意,如果不使用Value,我们可能会遇到文本是XML编码字符的问题。请查找我的博客,其中介绍了SQL server中分组连接的场景。不是真的。cyberkiwi使用cte:s的解决方案是纯sql,没有任何特定于供应商的黑客行为。在问答时,我不会认为递归cte具有非常好的可移植性,但Oracle现在支持它们。最好的解决方案将取决于平台。对于SQL Server,最有可能的是XML技术或客户CLR聚合。所有问题的最终答案是什么?问题]见:@marc_s也许更好的批评是,主键应该在表变量上声明。@marc_s进一步检查,那篇文章是假的——几乎所有关于没有IO度量的性能的讨论都是假的。我确实了解了LAG,所以非常感谢。感谢您的投入,我总是更喜欢使用CTE和递归CTE来解决SQL server中的问题。这是一个为我工作的很好!是否可以在带有外部应用程序的查询中使用它?假设您不希望列表中出现重复的名称,您可以这样做,也可以不这样做。分组现在是前端显示的事情了吗?在分组结果集中连接一列有很多有效的方案。我几年前使用过它,它的语法比所有XML路径技巧都要简洁,而且效果非常好。当SQL CLR函数是一个选项时,我强烈建议使用它。如果不使用值,我们可能会遇到文本是XML编码字符的问题,因为它可以完美地工作!
SELECT T3.DEPT, REPLACE(REPLACE(T3.ENAME,'{"ENAME":"',''),'"}','') AS ENAME_LIST
FROM (
 SELECT DEPT, (SELECT ENAME AS [ENAME]
        FROM EMPLOYEE T2
        WHERE T2.DEPT=T1.DEPT
        FOR JSON PATH,WITHOUT_ARRAY_WRAPPER) ENAME
    FROM EMPLOYEE T1
    GROUP BY DEPT) T3
WITH t AS (
    SELECT 1 n, 1 g, 1 v
    UNION ALL 
    SELECT 2 n, 1 g, 2 v
    UNION ALL 
    SELECT 3 n, 2 g, 3 v
)
SELECT g
        , STUFF (
                (
                    SELECT ', ' + CAST(v AS VARCHAR(MAX))
                    FROM t sub_t
                    WHERE sub_t.g = main_t.g
                    FOR XML PATH('')
                )
                , 1, 2, ''
        ) cg
FROM t main_t
GROUP BY g
*************************   ->  *********************
*   n   *   g   *   v   *       *   g   *   cg      *
*   -   *   -   *   -   *       *   -   *   -       *
*   1   *   1   *   1   *       *   1   *   1, 2    *
*   2   *   1   *   2   *       *   2   *   3       *
*   3   *   2   *   3   *       *********************
*************************   
CREATE TABLE #YourTable ([ID] INT, [Name] CHAR(1), [Value] INT)

INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (1,'A',4)
INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (1,'B',8)
INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (1,'B',5)
INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (2,'C',9)

-- retrieve each unique id and name columns and concatonate the values into one column
SELECT 
  [ID], 
  STUFF((
    SELECT ', ' + [Name] + ':' + CAST([Value] AS VARCHAR(MAX)) -- CONCATONATES EACH APPLICATION : VALUE SET      
    FROM #YourTable 
    WHERE (ID = Results.ID and Name = results.[name] ) 
    FOR XML PATH(''),TYPE).value('(./text())[1]','VARCHAR(MAX)')
  ,1,2,'') AS NameValues
FROM #YourTable Results
GROUP BY ID


SELECT 
  [ID],[Name] , --these are acting as the group by clause
  STUFF((
    SELECT ', '+  CAST([Value] AS VARCHAR(MAX)) -- CONCATONATES THE VALUES FOR EACH ID NAME COMBINATION 
    FROM #YourTable 
    WHERE (ID = Results.ID and Name = results.[name] ) 
    FOR XML PATH(''),TYPE).value('(./text())[1]','VARCHAR(MAX)')
  ,1,2,'') AS  NameValues
FROM #YourTable Results
GROUP BY ID, name

DROP TABLE #YourTable
  Declare @IdxList as Table(id int, choices varchar(max),AisName varchar(255))
  Insert into @IdxLIst(id,choices,AisName)
  Select IdxId,''''+Max(Title)+'''',Max(Title) From [dbo].[dta_Alias] 
 where IdxId is not null group by IdxId
  Update @IdxLIst
    set choices=choices +','''+Title+''''
    From @IdxLIst JOIN [dta_Alias] ON id=IdxId And Title <> AisName
    where IdxId is not null
    Select * from @IdxList where choices like '%,%'