如何在MySQL中返回数据透视表输出?
如果我有一个类似以下内容的MySQL表: company_name action pagecount ------------------------------- Company A PRINT 3 Company A PRINT 2 Company A PRINT 3 Company B EMAIL Company B PRINT 2 Company B PRINT 2 Company B PRINT 1 Company A PRINT 3 company_name EMAIL PRINT 1 pages PRINT 2 pages PRINT 3 pages ------------------------------------------------------------- CompanyA 0 0 1 3 CompanyB 1 1 2 0如何在MySQL中返回数据透视表输出?,mysql,sql,pivot,Mysql,Sql,Pivot,如果我有一个类似以下内容的MySQL表: company_name action pagecount ------------------------------- Company A PRINT 3 Company A PRINT 2 Company A PRINT 3 Company B EMAIL Company B PRINT 2 Company B PRINT 2 Company
CREATE TABLE `test_pivot` (
`pid` bigint(20) NOT NULL AUTO_INCREMENT,
`company_name` varchar(32) DEFAULT NULL,
`action` varchar(16) DEFAULT NULL,
`pagecount` bigint(20) DEFAULT NULL,
PRIMARY KEY (`pid`)
) ENGINE=MyISAM;
SELECT P.`company_name`,
COUNT(
CASE
WHEN P.`action`='EMAIL'
THEN 1
ELSE NULL
END
) AS 'EMAIL',
COUNT(
CASE
WHEN P.`action`='PRINT' AND P.`pagecount` = '1'
THEN P.`pagecount`
ELSE NULL
END
) AS 'PRINT 1 pages',
COUNT(
CASE
WHEN P.`action`='PRINT' AND P.`pagecount` = '2'
THEN P.`pagecount`
ELSE NULL
END
) AS 'PRINT 2 pages',
COUNT(
CASE
WHEN P.`action`='PRINT' AND P.`pagecount` = '3'
THEN P.`pagecount`
ELSE NULL
END
) AS 'PRINT 3 pages'
FROM test_pivot P
GROUP BY P.`company_name`;
是否可以运行MySQL查询以获得如下输出:
company_name action pagecount
-------------------------------
Company A PRINT 3
Company A PRINT 2
Company A PRINT 3
Company B EMAIL
Company B PRINT 2
Company B PRINT 2
Company B PRINT 1
Company A PRINT 3
company_name EMAIL PRINT 1 pages PRINT 2 pages PRINT 3 pages
-------------------------------------------------------------
CompanyA 0 0 1 3
CompanyB 1 1 2 0
CREATE TABLE `test_pivot` (
`pid` bigint(20) NOT NULL AUTO_INCREMENT,
`company_name` varchar(32) DEFAULT NULL,
`action` varchar(16) DEFAULT NULL,
`pagecount` bigint(20) DEFAULT NULL,
PRIMARY KEY (`pid`)
) ENGINE=MyISAM;
SELECT P.`company_name`,
COUNT(
CASE
WHEN P.`action`='EMAIL'
THEN 1
ELSE NULL
END
) AS 'EMAIL',
COUNT(
CASE
WHEN P.`action`='PRINT' AND P.`pagecount` = '1'
THEN P.`pagecount`
ELSE NULL
END
) AS 'PRINT 1 pages',
COUNT(
CASE
WHEN P.`action`='PRINT' AND P.`pagecount` = '2'
THEN P.`pagecount`
ELSE NULL
END
) AS 'PRINT 2 pages',
COUNT(
CASE
WHEN P.`action`='PRINT' AND P.`pagecount` = '3'
THEN P.`pagecount`
ELSE NULL
END
) AS 'PRINT 3 pages'
FROM test_pivot P
GROUP BY P.`company_name`;
其思想是pagecount可以变化,因此输出列的数量应该反映这一点,每个操作/pagecount对对应一列,然后是每个公司名称的点击数。我不确定这是否称为透视表,但有人建议?这基本上是一个透视表
有关如何实现这一点的教程,请参见:
我建议阅读这篇文章,并根据您的需要调整此解决方案
更新
在上面的链接现在不再可用之后,我觉得有义务为所有在这里搜索mysql pivot答案的人提供一些额外的信息。它确实有大量的信息,我不想把所有的信息都放在这里,因为我只是不想复制他们丰富的知识,但我将给出一些建议,说明如何以sql的方式处理数据透视表,通常是以peku的例子为例,他首先提出了这个问题
也许链接很快就会回来,我会留意的
电子表格方式
许多人只是使用MSExcel、OpenOffice或其他电子表格工具来实现这一目的。这是一个有效的解决方案,只需将数据复制到那里,然后使用GUI提供的工具来解决这个问题
但是。。。这不是问题,它甚至可能导致一些缺点,比如如何将数据放入电子表格,缩放问题等等
SQL方式
考虑到他的桌子看起来像这样:
company_name action pagecount
-------------------------------
Company A PRINT 3
Company A PRINT 2
Company A PRINT 3
Company B EMAIL
Company B PRINT 2
Company B PRINT 2
Company B PRINT 1
Company A PRINT 3
company_name EMAIL PRINT 1 pages PRINT 2 pages PRINT 3 pages
-------------------------------------------------------------
CompanyA 0 0 1 3
CompanyB 1 1 2 0
CREATE TABLE `test_pivot` (
`pid` bigint(20) NOT NULL AUTO_INCREMENT,
`company_name` varchar(32) DEFAULT NULL,
`action` varchar(16) DEFAULT NULL,
`pagecount` bigint(20) DEFAULT NULL,
PRIMARY KEY (`pid`)
) ENGINE=MyISAM;
SELECT P.`company_name`,
COUNT(
CASE
WHEN P.`action`='EMAIL'
THEN 1
ELSE NULL
END
) AS 'EMAIL',
COUNT(
CASE
WHEN P.`action`='PRINT' AND P.`pagecount` = '1'
THEN P.`pagecount`
ELSE NULL
END
) AS 'PRINT 1 pages',
COUNT(
CASE
WHEN P.`action`='PRINT' AND P.`pagecount` = '2'
THEN P.`pagecount`
ELSE NULL
END
) AS 'PRINT 2 pages',
COUNT(
CASE
WHEN P.`action`='PRINT' AND P.`pagecount` = '3'
THEN P.`pagecount`
ELSE NULL
END
) AS 'PRINT 3 pages'
FROM test_pivot P
GROUP BY P.`company_name`;
现在查看他/她想要的表格:
company_name EMAIL PRINT 1 pages PRINT 2 pages PRINT 3 pages
-------------------------------------------------------------
CompanyA 0 0 1 3
CompanyB 1 1 2 0
行电子邮件、打印x页类似于条件。主要分组是按公司名称进行的
为了设置条件,这相当于使用-语句。为了按某物分组,那么,使用。。。分组
提供此数据透视的基本SQL可以如下所示:
company_name action pagecount
-------------------------------
Company A PRINT 3
Company A PRINT 2
Company A PRINT 3
Company B EMAIL
Company B PRINT 2
Company B PRINT 2
Company B PRINT 1
Company A PRINT 3
company_name EMAIL PRINT 1 pages PRINT 2 pages PRINT 3 pages
-------------------------------------------------------------
CompanyA 0 0 1 3
CompanyB 1 1 2 0
CREATE TABLE `test_pivot` (
`pid` bigint(20) NOT NULL AUTO_INCREMENT,
`company_name` varchar(32) DEFAULT NULL,
`action` varchar(16) DEFAULT NULL,
`pagecount` bigint(20) DEFAULT NULL,
PRIMARY KEY (`pid`)
) ENGINE=MyISAM;
SELECT P.`company_name`,
COUNT(
CASE
WHEN P.`action`='EMAIL'
THEN 1
ELSE NULL
END
) AS 'EMAIL',
COUNT(
CASE
WHEN P.`action`='PRINT' AND P.`pagecount` = '1'
THEN P.`pagecount`
ELSE NULL
END
) AS 'PRINT 1 pages',
COUNT(
CASE
WHEN P.`action`='PRINT' AND P.`pagecount` = '2'
THEN P.`pagecount`
ELSE NULL
END
) AS 'PRINT 2 pages',
COUNT(
CASE
WHEN P.`action`='PRINT' AND P.`pagecount` = '3'
THEN P.`pagecount`
ELSE NULL
END
) AS 'PRINT 3 pages'
FROM test_pivot P
GROUP BY P.`company_name`;
这将很快提供所需的结果。这种方法的主要缺点是,希望透视表中的行越多,需要在SQL语句中定义的条件就越多
这也是可以处理的,因此人们倾向于使用预先准备好的语句、例程、计数器等等
有关此主题的其他一些链接:
我的解决方案是T-SQL,没有任何数据透视:
SELECT
CompanyName,
SUM(CASE WHEN (action='EMAIL') THEN 1 ELSE 0 END) AS Email,
SUM(CASE WHEN (action='PRINT' AND pagecount=1) THEN 1 ELSE 0 END) AS Print1Pages,
SUM(CASE WHEN (action='PRINT' AND pagecount=2) THEN 1 ELSE 0 END) AS Print2Pages,
SUM(CASE WHEN (action='PRINT' AND pagecount=3) THEN 1 ELSE 0 END) AS Print3Pages
FROM
Company
GROUP BY
CompanyName
对于MySQL,您可以直接将条件放入SUM函数中,它将被计算为布尔值0或1,因此您可以根据您的条件进行计数,而无需使用IF/CASE语句
SELECT
company_name,
SUM(action = 'EMAIL')AS Email,
SUM(action = 'PRINT' AND pagecount = 1)AS Print1Pages,
SUM(action = 'PRINT' AND pagecount = 2)AS Print2Pages,
SUM(action = 'PRINT' AND pagecount = 3)AS Print3Pages
FROM t
GROUP BY company_name
对于动态轴,请将组_CONCAT与CONCAT一起使用。
该函数使用各种选项将组中的字符串连接为一个字符串
SET @sql = NULL;
SELECT
GROUP_CONCAT(DISTINCT
CONCAT(
'SUM(CASE WHEN action = "',
action,'" AND ',
(CASE WHEN pagecount IS NOT NULL
THEN CONCAT("pagecount = ",pagecount)
ELSE pagecount IS NULL END),
' THEN 1 ELSE 0 end) AS ',
action, IFNULL(pagecount,'')
)
)
INTO @sql
FROM
t;
SET @sql = CONCAT('SELECT company_name, ', @sql, '
FROM t
GROUP BY company_name');
PREPARE stmt FROM @sql;
EXECUTE stmt;
DEALLOCATE PREPARE stmt;
标准SQL版本,使用:
怎么做
TRUE或NULL将生成TRUE。
FALSE或NULL产生NULL。
NULL或NULL产生NULL。
并且只统计非空值。瞧。有一个名为MySQL Pivot table generator的工具,它可以帮助您创建基于web的Pivot表,如果您愿意,可以稍后导出到Excel。如果您的数据在一个表或多个表中,它就可以工作 您所需要做的就是指定它支持的列的数据源、动态列、行、表体中的值以及表关系(如果有) 此工具的主页是正确答案是:
select table_record_id,
group_concat(if(value_name='note', value_text, NULL)) as note
,group_concat(if(value_name='hire_date', value_text, NULL)) as hire_date
,group_concat(if(value_name='termination_date', value_text, NULL)) as termination_date
,group_concat(if(value_name='department', value_text, NULL)) as department
,group_concat(if(value_name='reporting_to', value_text, NULL)) as reporting_to
,group_concat(if(value_name='shift_start_time', value_text, NULL)) as shift_start_time
,group_concat(if(value_name='shift_end_time', value_text, NULL)) as shift_end_time
from other_value
where table_name = 'employee'
and is_active = 'y'
and is_deleted = 'n'
GROUP BY table_record_id
一种选择是结合使用CASE..WHEN语句在MySQL数据库聚合中是冗余的,并考虑动态生成所需的查询,同时为结果集获取适当的列标题,如以下代码块所示:
SET @sql = NULL;
SELECT GROUP_CONCAT(
CONCAT('SUM( `action` = ''', action, '''',pc0,' ) AS ',action,pc1)
)
INTO @sql
FROM
(
SELECT DISTINCT `action`,
IF(`pagecount` IS NULL,'',CONCAT('page',`pagecount`)) AS pc1,
IF(`pagecount` IS NULL,'',CONCAT(' AND `pagecount` = ', pagecount, '')) AS pc0
FROM `tab`
ORDER BY CONCAT(action,pc0)
) t;
SET @sql = CONCAT('SELECT company_name,',@sql,' FROM `tab` GROUP BY company_name');
SELECT @sql;
PREPARE stmt FROM @sql;
EXECUTE stmt;
DEALLOCATE PREPARE stmt;
它被称为数据透视,在SQL之外进行这种转换要快得多。Excel会处理类似的事情,在MySQL中这是非常困难的,因为没有交叉表操作符:是的,它目前在Excel中手工完成,我们正在尝试将其自动化。这里我找到了一个逐步的示例:。和@giannischristofakis-这真的取决于你和你的同事认为什么更简单。自从我发表这条评论4年以来,技术进步很大,所以这完全取决于您感觉更好的方面——无论是应用程序还是SQL。例如,在我的工作中,我们处理类似的问题,但我们将SQL和应用程序内方法结合起来。基本上,我只能给你一个固执己见的答案,而这并不是你需要的:这个链接现在似乎有效。。。如果它再次出现故障,请尝试以下方法:Google的缓存或Internet Wayback Machine*/link可在此url访问还有另一种方法可以生成透视表,而无需使用if,case,或者GROUP_CONCAT:您可以从您的案例中删除ELSE NULL,因为hat是默认行为,条件聚合是冗长的,尽管这是一个非常简洁的行为。你知道这是否与其他平台(如Postgres)的标准兼容吗?@itsols No its仅适用于Mysqlspecific@itsols:我又加了一个。Postgres也有一个Sqlite的作品,这是我一直在寻找的
对于真是太棒了,这对我来说甚至在PostgreSQL上都很有用。我更喜欢这种方法,而不是在Postgres上使用交叉表扩展,因为这很干净。我的解决方案是在T-SQL中,没有任何数据透视:不仅是SQL Server,它还应该适用于大多数遵循ANSI SQL标准的数据库供应商。请注意,如果要透视字符串,SUM只能处理数字数据。您必须使用MAXI。我认为SUMCASE中的大小写不必要。当action='PRINT'和pagecount=1,然后1或0结束时,您可以只执行SUMCASE='PRINT'和pagecount=1,因为条件将在为true时转换为1,在为0时转换为0false@kajacx对虽然在没有这种布尔操作的数据库上需要它。给出了一个选择,一个是适用于所有数据库的较长语法,另一个是仅适用于所有数据库的较短语法。。。我会选择former@Erwin,但你怎么知道有三列呢?如果有5个呢?10? 20?@Pacerier:问题中的例子似乎表明了这一点。无论如何,SQL都要求知道返回类型。完全动态查询是不可能的。如果输出列的数量可能不同,则需要两个步骤:第一步:构建查询,第二步:执行查询。Pacerier,true man但对于动态数据透视来说,这是最好的方法之一。如果操作列中有许多值,或者期望该列表随时间增长,则此方法效果良好,因为为每个值编写一个case语句可能很耗时,而且很难跟上最新的情况。这只是您手头上的一个示例吗?另一个_值表的结构是什么?正确答案是:很可能不是因为在1024个GROUP_CONCAT简单地截断字符串而没有出现错误意味着可能会出现意外结果之后,它丢失了SET查询以增加defualt值,而GROUP_CONCAT的defualt值被限制为1024。抱歉,伙计们记不起进一步的细节。我做一些有趣的事情,然后忘记或破坏整个项目。但当我遇到挑战时,我会分享我是如何解决的。我知道我的例子不太详细,但我想它可能会给那些知道自己面临什么的人指明方向: