如何从关系mysql表中快速选择max(时间戳)

如何从关系mysql表中快速选择max(时间戳),mysql,sql,group-by,query-optimization,relational,Mysql,Sql,Group By,Query Optimization,Relational,我们正在开发一个票证系统,对于仪表板,我们希望显示票证的最新状态。我们有两张桌子。第一个表用于票据本身,第二个表用于单独编辑 系统已在运行,但仪表板的性能非常差,约1300张车票需要6秒。首先,我们使用一个statemant,它为每个票据选择“where timestamp=select maxtimstamp”。在第二步中,我们创建了一个视图,该视图只包含每个票证的最新时间戳,但我们无法在该视图中包含正确的状态 因此,主要的问题可能是,我们无法构建一个表,其中为每个票据选择了最新的ins_日期

我们正在开发一个票证系统,对于仪表板,我们希望显示票证的最新状态。我们有两张桌子。第一个表用于票据本身,第二个表用于单独编辑

系统已在运行,但仪表板的性能非常差,约1300张车票需要6秒。首先,我们使用一个statemant,它为每个票据选择“where timestamp=select maxtimstamp”。在第二步中,我们创建了一个视图,该视图只包含每个票证的最新时间戳,但我们无法在该视图中包含正确的状态

因此,主要的问题可能是,我们无法构建一个表,其中为每个票据选择了最新的ins_日期和最新状态

简化的数据库如下所示:

CREATE TABLE `ticket` (
  `id` int(10) NOT NULL,
  `betreff` varchar(100) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

CREATE TABLE `ticket_relation` (
  `id` int(11) NOT NULL,
  `ticket` int(10) NOT NULL,
  `info` varchar(10000) DEFAULT NULL,
  `status` int(1) NOT NULL DEFAULT '0',
  `ins_date` timestamp NULL DEFAULT CURRENT_TIMESTAMP,
  `ins_user` int(11) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;


INSERT INTO `ticket` (`id`, `betreff`) VALUES
(1, 'Technische Frage'),
(2, 'Ticket 2'),
(3, 'Weitere Fragen');

INSERT INTO `ticket_relation` (`id`, `ticket`, `info`, `status`, `ins_date`, `ins_user`) VALUES
(1, 1, 'Betreff 1', 0, '2019-05-28 11:02:18', 123),
(2, 1, 'Betreff 2', 3, '2019-05-28 12:07:36', 123),
(3, 2, 'Betreff 3', 0, '2019-05-29 06:49:32', 123),
(4, 3, 'Betreff 4', 1, '2019-05-29 07:44:07', 123),
(5, 2, 'Betreff 5', 1, '2019-05-29 07:49:32', 123),
(6, 2, 'Betreff 6', 3, '2019-05-29 08:49:32', 123),
(7, 3, 'Betreff 7', 2, '2019-05-29 09:49:32', 123),
(8, 2, 'Betreff 8', 1, '2019-05-29 10:49:32', 123),
(9, 3, 'Betreff 9', 2, '2019-05-29 11:49:32', 123),
(10, 3, 'Betreff 10', 3, '2019-05-29 12:49:32', 123);
我创建了一个SQL小提琴: 前三条语句是不正确或速度太慢的尝试。最后一个是关键,我想,但我不明白,为什么这会导致状态错误

尝试为每个票证创建具有最新INSU日期和状态的表:

SELECT
  ticket, status, MAX(ins_date) as max_date 
FROM 
  ticket_relation 
GROUP BY 
  ticket
ORDER BY 
  ins_date DESC;
此查询获取每张票据的正确最新登录日期,但不获取最新状态:

+--------+--------+----------------------+
| ticket | status | max_date             |
+--------+--------+----------------------+
| 3      | 1      | 2019-05-29T12:49:32Z |
+--------+--------+----------------------+
| 2      | 0      | 2019-05-29T10:49:32Z |
+--------+--------+----------------------+
| 1      | 0      | 2019-05-28T12:07:36Z |
+--------+--------+----------------------+
预期产出如下:

+--------+--------+----------------------+
| ticket | status | max_date             |
+--------+--------+----------------------+
| 3      | 3      | 2019-05-29T12:49:32Z |
+--------+--------+----------------------+
| 2      | 1      | 2019-05-29T10:49:32Z |
+--------+--------+----------------------+
| 1      | 3      | 2019-05-28T12:07:36Z |
+--------+--------+----------------------+

有没有一种有效的方法可以为tiket表中的每张票证选择最新的时间戳和状态?

您可以在下面的查询中尝试-

SELECT
  ticket, status, ins_date as max_date 
FROM ticket_relation a
where ins_date in (select max(ins_date) from ticket_relation b where a.ticket=b.ticket)

一种解决方案是使用子查询计算每个票据的最新插入日期,然后将结果与原始表连接,如:

SELECT t.ticket, t.status, t.ins_date
FROM ticket_relation  t
INNER JOIN (
    SELECT ticket, max(ins_date) max_ins_date
    FROM ticket_relation 
    GROUP BY ticket
) x ON t.ticket = x.ticket AND t.ins_date = x.max_ins_date
为了更好地执行此查询,您需要一个票证索引INSU date

另一个选项是使用NOT EXISTS条件确保只选择最新记录,如:

SELECT t.ticket, t.status, t.ins_date
FROM ticket_relation  t
WHERE NOT EXISTS (
    SELECT 1 
    FROM ticket_relation t1 
    WHERE t1.ticket = t.ticket AND t1.ins_date > t.ins_date)
)
注意:处理GROUP BY时,所有非聚合列必须出现在GROUP BY子句中。否则,您将得到错误或不可执行的结果,具体取决于服务器选项ONLY\u FULL\u GROUP\u BY分别处于启用或禁用状态

如果您能够升级到mysql 8.0的最新版本,则可以使用窗口函数简化查询并可能提高其性能,如:

SELECT ticket, status, ins_date
FROM (
    SELECT 
        ticket, 
        status, 
        ins_date, 
        row_number() over(partition by ticket order by ins_date desc) rn
    FROM ticket_relation  
) x WHERE rn = 1

另一种方法是认为过滤而不是分组

质疑


此查询需要索引KEYticket、INSU date、id才能获得最大性能

您使用的是哪个版本的MySQL?是5.6吗,如fiddle中所示?是时候在MySQL服务器上只启用_FULL_GROUP_BY了,这可以防止您写入无效的GROUP BY,假设您的MySQL版本支持它。MySQL服务器5.5.62没有主键??没有有用的索引??为什么它会获得正确的状态?如果您不告诉我们您为什么期望手册/文档中的期望值,我们如何才能告诉您哪里错了&除了语言的工作原理之外,我们还能回答什么?PS efficient表示没有什么特别的。此查询中有一个错误,因为您从ticket中选择了ticket,但此列不存在。如果我将查询更正为“``选择t.ticket,t.status,t.ins\u date FROM ticket\u relation t internal JOIN SELECT ticket,maxins\u date FROM ticket\u relationship GROUP BY ticket x ON t.ticket=x.ticket``通过此查询,我会为每个ticket获得多行,这不是我想要的结果。@HeNiNnG:刚刚修复了一个键入缺失的连接条件,让我知道这对你来说是否可行,新的?前两个查询执行得非常快和正确@亨宁:很高兴听到这个消息。另外,请确保您已准备好重新开始的索引…如果我在数据库上尝试此查询,它将运行大约2-3秒,我认为在@Raymond nijl建议的向列ticket和ins_date添加索引后,这太长了。此查询执行速度也非常快。它工作正常,但速度太慢。在数据库上,这个查询大约运行3秒,我认为这太长了。编辑:好的,哇。我在INSU日期和票证id上添加了索引,现在它的性能非常快!通过两列上的索引,我的旧查询现在与答案->接受中的建议查询一样快answer@HeNiNnG问题中不清楚您是否有索引以及您使用的存储引擎不是这样的,我在索引中也包括了id列。。
SELECT 
   ticket_relation_1.ticket
 , ticket_relation_1.status 
 , ticket_relation_1.ins_date
FROM 
 ticket_relation AS ticket_relation_1
LEFT JOIN
 ticket_relation AS ticket_relation_2
ON
   ticket_relation_1.ticket = ticket_relation_2.ticket
 AND
   ticket_relation_1.ins_date < ticket_relation_2.ins_date
 WHERE 
  ticket_relation_2.id IS NULL
ORDER BY 
 ticket_relation_1.id DESC
| ticket | status | ins_date            |
| ------ | ------ | ------------------- |
| 3      | 3      | 2019-05-29 12:49:32 |
| 2      | 1      | 2019-05-29 10:49:32 |
| 1      | 3      | 2019-05-28 12:07:36 |