Sql 基于另一列中的更改创建带有时间戳的最后修改列
我试图添加一个新列,指示另一列的最后修改日期。就我而言,我有一些项目是在特定时间(例如5/1/19)启动的,具有特定状态。在某些情况下,项目可能会更改其状态(已取消或已停止)。每天早上都会拍摄一个快照,在这种情况下,快照可用于跟踪上次修改日期 有不同的项目(ID、名称)和不同类型的状态 目前:Sql 基于另一列中的更改创建带有时间戳的最后修改列,sql,postgresql,datetime,window-functions,gaps-and-islands,Sql,Postgresql,Datetime,Window Functions,Gaps And Islands,我试图添加一个新列,指示另一列的最后修改日期。就我而言,我有一些项目是在特定时间(例如5/1/19)启动的,具有特定状态。在某些情况下,项目可能会更改其状态(已取消或已停止)。每天早上都会拍摄一个快照,在这种情况下,快照可用于跟踪上次修改日期 有不同的项目(ID、名称)和不同类型的状态 目前: project_ID Name Status Date 1 ABC Cancelled 1/4/20 1 ABC
project_ID Name Status Date
1 ABC Cancelled 1/4/20
1 ABC Cancelled 1/3/20
1 ABC Continued 1/2/20
1 ABC Continued 1/1/20
.. ... ......... ......
1 ABC Continued 5/1/19
我希望实现下表:
project_ID Name Status Date LastModified
1 ABC Cancelled 1/4/20 1/3/20
1 ABC Cancelled 1/3/20 1/3/20
1 ABC Continued 1/2/20 5/1/19
1 ABC Continued 1/1/20 5/1/19
.. ... ......... ...... ......
1 ABC Continued 5/1/19 5/1/19
这是一种缺口和孤岛问题,您需要确定每个孤岛的起点。每天有一条记录这一事实稍微简化了解决方案:我将使用
row_number()
和日期算法来定义相邻记录的组,然后使用一个窗口min来获得每个组的第一个日期
select t.*,
min(date) over(partition by project_id, status, date - rn * interval '1 day') last_modified
from (
select t.*, row_number() over(partition by project_id, status order by date) rn
from mytable t
) t
order by project_id, date
这是一种缺口和孤岛问题,您需要确定每个孤岛的起点。每天有一条记录这一事实稍微简化了解决方案:我将使用
row_number()
和日期算法来定义相邻记录的组,然后使用一个窗口min来获得每个组的第一个日期
select t.*,
min(date) over(partition by project_id, status, date - rn * interval '1 day') last_modified
from (
select t.*, row_number() over(partition by project_id, status order by date) rn
from mytable t
) t
order by project_id, date
您也可以使用
lag()
和累积最大:
select t.*,
max(date) filter (where prev_status is distinct from status) over (partition by project_id, name order by date) as last_change_date
from (select t.*,
lag(status) over (partition by project_id, name order by date) as prev_status
from t
) t;
子查询计算以前的状态,以识别任何更改。然后,外部查询获取检测到状态更改的最长日期
这种方法的一个优点(或者缺点?)是,如果缺少任何快照日期,它是健壮的。任何此类间隙都会被忽略。您也可以使用
lag()
和累积最大值来解决此问题:
select t.*,
max(date) filter (where prev_status is distinct from status) over (partition by project_id, name order by date) as last_change_date
from (select t.*,
lag(status) over (partition by project_id, name order by date) as prev_status
from t
) t;
子查询计算以前的状态,以识别任何更改。然后,外部查询获取检测到状态更改的最长日期
这种方法的一个优点(或者缺点?)是,如果缺少任何快照日期,它是健壮的。任何这样的差距都会被忽略。我通过使用@Philipp Johannis建议的查询解决了这个问题 在这里,我使用了最小值而不是最大值:
SELECT project_id,
status,
date,
MIN(date)OVER(PARTITION BY project_id, status) AS LastModified
FROM TableABC
ORDER BY date DESC
我无法正确运行其他两个答案,而此解决方案似乎更易于阅读和理解,这就是为什么我将此答案作为解决方案突出显示。我能够通过使用@Philipp Johannis建议的查询来解决此问题 在这里,我使用了最小值而不是最大值:
SELECT project_id,
status,
date,
MIN(date)OVER(PARTITION BY project_id, status) AS LastModified
FROM TableABC
ORDER BY date DESC
我无法正确运行其他两个答案,而此解决方案似乎更易于阅读和理解,这就是为什么我将此答案突出显示为解决方案。提供表格的示例数据提供表格的示例数据