如何从关系mysql表中快速选择max(时间戳)
我们正在开发一个票证系统,对于仪表板,我们希望显示票证的最新状态。我们有两张桌子。第一个表用于票据本身,第二个表用于单独编辑 系统已在运行,但仪表板的性能非常差,约1300张车票需要6秒。首先,我们使用一个statemant,它为每个票据选择“where timestamp=select maxtimstamp”。在第二步中,我们创建了一个视图,该视图只包含每个票证的最新时间戳,但我们无法在该视图中包含正确的状态 因此,主要的问题可能是,我们无法构建一个表,其中为每个票据选择了最新的ins_日期和最新状态 简化的数据库如下所示:如何从关系mysql表中快速选择max(时间戳),mysql,sql,group-by,query-optimization,relational,Mysql,Sql,Group By,Query Optimization,Relational,我们正在开发一个票证系统,对于仪表板,我们希望显示票证的最新状态。我们有两张桌子。第一个表用于票据本身,第二个表用于单独编辑 系统已在运行,但仪表板的性能非常差,约1300张车票需要6秒。首先,我们使用一个statemant,它为每个票据选择“where timestamp=select maxtimstamp”。在第二步中,我们创建了一个视图,该视图只包含每个票证的最新时间戳,但我们无法在该视图中包含正确的状态 因此,主要的问题可能是,我们无法构建一个表,其中为每个票据选择了最新的ins_日期
CREATE TABLE `ticket` (
`id` int(10) NOT NULL,
`betreff` varchar(100) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
CREATE TABLE `ticket_relation` (
`id` int(11) NOT NULL,
`ticket` int(10) NOT NULL,
`info` varchar(10000) DEFAULT NULL,
`status` int(1) NOT NULL DEFAULT '0',
`ins_date` timestamp NULL DEFAULT CURRENT_TIMESTAMP,
`ins_user` int(11) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
INSERT INTO `ticket` (`id`, `betreff`) VALUES
(1, 'Technische Frage'),
(2, 'Ticket 2'),
(3, 'Weitere Fragen');
INSERT INTO `ticket_relation` (`id`, `ticket`, `info`, `status`, `ins_date`, `ins_user`) VALUES
(1, 1, 'Betreff 1', 0, '2019-05-28 11:02:18', 123),
(2, 1, 'Betreff 2', 3, '2019-05-28 12:07:36', 123),
(3, 2, 'Betreff 3', 0, '2019-05-29 06:49:32', 123),
(4, 3, 'Betreff 4', 1, '2019-05-29 07:44:07', 123),
(5, 2, 'Betreff 5', 1, '2019-05-29 07:49:32', 123),
(6, 2, 'Betreff 6', 3, '2019-05-29 08:49:32', 123),
(7, 3, 'Betreff 7', 2, '2019-05-29 09:49:32', 123),
(8, 2, 'Betreff 8', 1, '2019-05-29 10:49:32', 123),
(9, 3, 'Betreff 9', 2, '2019-05-29 11:49:32', 123),
(10, 3, 'Betreff 10', 3, '2019-05-29 12:49:32', 123);
我创建了一个SQL小提琴:
前三条语句是不正确或速度太慢的尝试。最后一个是关键,我想,但我不明白,为什么这会导致状态错误
尝试为每个票证创建具有最新INSU日期和状态的表:
SELECT
ticket, status, MAX(ins_date) as max_date
FROM
ticket_relation
GROUP BY
ticket
ORDER BY
ins_date DESC;
此查询获取每张票据的正确最新登录日期,但不获取最新状态:
+--------+--------+----------------------+
| ticket | status | max_date |
+--------+--------+----------------------+
| 3 | 1 | 2019-05-29T12:49:32Z |
+--------+--------+----------------------+
| 2 | 0 | 2019-05-29T10:49:32Z |
+--------+--------+----------------------+
| 1 | 0 | 2019-05-28T12:07:36Z |
+--------+--------+----------------------+
预期产出如下:
+--------+--------+----------------------+
| ticket | status | max_date |
+--------+--------+----------------------+
| 3 | 3 | 2019-05-29T12:49:32Z |
+--------+--------+----------------------+
| 2 | 1 | 2019-05-29T10:49:32Z |
+--------+--------+----------------------+
| 1 | 3 | 2019-05-28T12:07:36Z |
+--------+--------+----------------------+
有没有一种有效的方法可以为tiket表中的每张票证选择最新的时间戳和状态?您可以在下面的查询中尝试-
SELECT
ticket, status, ins_date as max_date
FROM ticket_relation a
where ins_date in (select max(ins_date) from ticket_relation b where a.ticket=b.ticket)
一种解决方案是使用子查询计算每个票据的最新插入日期,然后将结果与原始表连接,如:
SELECT t.ticket, t.status, t.ins_date
FROM ticket_relation t
INNER JOIN (
SELECT ticket, max(ins_date) max_ins_date
FROM ticket_relation
GROUP BY ticket
) x ON t.ticket = x.ticket AND t.ins_date = x.max_ins_date
为了更好地执行此查询,您需要一个票证索引INSU date
另一个选项是使用NOT EXISTS条件确保只选择最新记录,如:
SELECT t.ticket, t.status, t.ins_date
FROM ticket_relation t
WHERE NOT EXISTS (
SELECT 1
FROM ticket_relation t1
WHERE t1.ticket = t.ticket AND t1.ins_date > t.ins_date)
)
注意:处理GROUP BY时,所有非聚合列必须出现在GROUP BY子句中。否则,您将得到错误或不可执行的结果,具体取决于服务器选项ONLY\u FULL\u GROUP\u BY分别处于启用或禁用状态
如果您能够升级到mysql 8.0的最新版本,则可以使用窗口函数简化查询并可能提高其性能,如:
SELECT ticket, status, ins_date
FROM (
SELECT
ticket,
status,
ins_date,
row_number() over(partition by ticket order by ins_date desc) rn
FROM ticket_relation
) x WHERE rn = 1
另一种方法是认为过滤而不是分组 质疑 看
此查询需要索引KEYticket、INSU date、id才能获得最大性能 您使用的是哪个版本的MySQL?是5.6吗,如fiddle中所示?是时候在MySQL服务器上只启用_FULL_GROUP_BY了,这可以防止您写入无效的GROUP BY,假设您的MySQL版本支持它。MySQL服务器5.5.62没有主键??没有有用的索引??为什么它会获得正确的状态?如果您不告诉我们您为什么期望手册/文档中的期望值,我们如何才能告诉您哪里错了&除了语言的工作原理之外,我们还能回答什么?PS efficient表示没有什么特别的。此查询中有一个错误,因为您从ticket中选择了ticket,但此列不存在。如果我将查询更正为“``选择t.ticket,t.status,t.ins\u date FROM ticket\u relation t internal JOIN SELECT ticket,maxins\u date FROM ticket\u relationship GROUP BY ticket x ON t.ticket=x.ticket``通过此查询,我会为每个ticket获得多行,这不是我想要的结果。@HeNiNnG:刚刚修复了一个键入缺失的连接条件,让我知道这对你来说是否可行,新的?前两个查询执行得非常快和正确@亨宁:很高兴听到这个消息。另外,请确保您已准备好重新开始的索引…如果我在数据库上尝试此查询,它将运行大约2-3秒,我认为在@Raymond nijl建议的向列ticket和ins_date添加索引后,这太长了。此查询执行速度也非常快。它工作正常,但速度太慢。在数据库上,这个查询大约运行3秒,我认为这太长了。编辑:好的,哇。我在INSU日期和票证id上添加了索引,现在它的性能非常快!通过两列上的索引,我的旧查询现在与答案->接受中的建议查询一样快answer@HeNiNnG问题中不清楚您是否有索引以及您使用的存储引擎不是这样的,我在索引中也包括了id列。。
SELECT
ticket_relation_1.ticket
, ticket_relation_1.status
, ticket_relation_1.ins_date
FROM
ticket_relation AS ticket_relation_1
LEFT JOIN
ticket_relation AS ticket_relation_2
ON
ticket_relation_1.ticket = ticket_relation_2.ticket
AND
ticket_relation_1.ins_date < ticket_relation_2.ins_date
WHERE
ticket_relation_2.id IS NULL
ORDER BY
ticket_relation_1.id DESC
| ticket | status | ins_date |
| ------ | ------ | ------------------- |
| 3 | 3 | 2019-05-29 12:49:32 |
| 2 | 1 | 2019-05-29 10:49:32 |
| 1 | 3 | 2019-05-28 12:07:36 |