Sql 选择使用另一行数据的查询
我有一个具有以下结构的表问题:Sql 选择使用另一行数据的查询,sql,postgresql,window-functions,Sql,Postgresql,Window Functions,我有一个具有以下结构的表问题: +----+---------+-------------+------------+ | id | project | new_status | updated_at | +----+---------+-------------+------------+ | 1 | 1 | New | 12:41:18 | | 1 | 1 | In progress | 12:47:43 | | 1 | 1
+----+---------+-------------+------------+
| id | project | new_status | updated_at |
+----+---------+-------------+------------+
| 1 | 1 | New | 12:41:18 |
| 1 | 1 | In progress | 12:47:43 |
| 1 | 1 | Resolved | 17:05:29 |
+----+---------+-------------+------------+
我需要实现一个查询,返回特定项目的每个问题在每个状态下花费的时间,类似于:
+----+---------+-------------+------------+
| id | project | new_status | time_diff |
+----+---------+-------------+------------+
| 1 | 1 | New | 00:06:25 |
| 1 | 1 | In progress | 04:17:46 |
+----+---------+-------------+------------+
我怎么能得到这个?最好不要使用特殊的具体数据库特性,即只使用纯SQL。但如果有关系的话,我正在使用PostgreSQL。可能是一个简单的第二个表,其中包含项目id、步骤名称、开始时间和停止时间。对步骤进行排序的某种方法,例如简单的数字序列。然后在项目id上的两个表之间运行联接,按步骤id排序,步骤的开始时间从结束时间中减去。使用case语句显示当前步骤没有结束时间。o可能是一个简单的第二个表,其中包含项目id、步骤名称、开始时间和停止时间。对步骤进行排序的某种方法,例如简单的数字序列。然后在项目id上的两个表之间运行联接,按步骤id排序,步骤的开始时间从结束时间中减去。使用case语句显示当前步骤没有结束时间。o我动态编写此查询,因此它不会被测试:
SELECT id, project, new_status, (updated_at - nextUpdate) AS time_diff
--or CAST((updated_at - nextUpdate) AS time) AS time_diff
FROM (
SELECT *,
LEAD(updated_at) OVER (PARTITION BY project ORDER BY updated_at) AS nextUpdate
FROM yourTable) dt
WHERE nextUpdate IS NOT NULL;
一个相关的答案是。我动态地编写了这个查询,因此它没有经过测试:
SELECT id, project, new_status, (updated_at - nextUpdate) AS time_diff
--or CAST((updated_at - nextUpdate) AS time) AS time_diff
FROM (
SELECT *,
LEAD(updated_at) OVER (PARTITION BY project ORDER BY updated_at) AS nextUpdate
FROM yourTable) dt
WHERE nextUpdate IS NOT NULL;
相关答案是。如果缺少下一步,则假设当前时区的当前时间:
SELECT *
FROM (
SELECT *, lead(updated_at, 1, now()::time(0)) OVER (PARTITION BY id, project
ORDER BY updated_at)
- updated_at AS time_diff
FROM issue
) sub
WHERE new_status <> 'Resolved' -- hide 'Resolved' row
ORDER BY updated_at;
您的示例显示了时间值,这通常是一个有问题的选择。如果事件跨越多天怎么办?考虑一下。
如果没有下一行或上一行,则可以提供默认值。我使用当前时间,不含小数秒。如果缺少下一步,则假设当前时区的当前时间:
SELECT *
FROM (
SELECT *, lead(updated_at, 1, now()::time(0)) OVER (PARTITION BY id, project
ORDER BY updated_at)
- updated_at AS time_diff
FROM issue
) sub
WHERE new_status <> 'Resolved' -- hide 'Resolved' row
ORDER BY updated_at;
您的示例显示了时间值,这通常是一个有问题的选择。如果事件跨越多天怎么办?考虑一下。
如果没有下一行或上一行,则可以提供默认值。我使用当前时间,不使用小数秒。因为您已经有一些使用lead函数的示例,这些函数肯定是特定于数据库的,所以这里有一个不同的选项: 此选项使用公共表表达式为每个项目创建一个使用行号的索引,然后基于该索引将表左键联接到自身;也就是说t2.ndx=t1.ndx+1 从这里开始,就需要计算时间差并将其格式化以供显示
如果您想查看问题在“已解决”状态下经过了多长时间,那么如果t2.updated_at为空,请使用coalescet2.updated_at、localtime之类的方法获取当前时间。因为您已经有一些使用lead函数的示例,这些函数肯定是特定于数据库的,所以这里有一个不同的选项: 此选项使用公共表表达式为每个项目创建一个使用行号的索引,然后基于该索引将表左键联接到自身;也就是说t2.ndx=t1.ndx+1 从这里开始,就需要计算时间差并将其格式化以供显示
如果您想查看问题处于“已解决”状态已经过了多长时间,那么如果t2.updated_at为空,请使用coalescet2.updated_at、localtime之类的方法来获取当前时间。一如既往,您的Postgres版本和您在psql中获得的\d问题的表定义应该是问题所在。示例数据很有用,但我们看不到数据类型和约束。并且您没有定义如何处理尚未解决的项目。与往常一样,您的Postgres版本和表定义在psql中遇到的问题应该是一个问题。示例数据很有用,但我们看不到数据类型和约束。并且您没有定义如何处理尚未解决的项目。窗口功能主管是标准SQL。在大型RDMS中,只有MySQL不支持它——这跟不上发展的步伐,它也不支持查询中的CTE。窗口函数的引导是标准SQL。在大型RDM中,只有MySQL不支持它——这跟不上发展的步伐,它也不支持查询中的CTE。