Sql 连续日期的群岛,包括缺少的周末
我有一个很大的数据集,其中包含某些操作的日期,我正在尝试计算连续的日期。我四处寻找,发现了这个:它近乎完美,它正是我想要的。不幸的是,由于我的数据集,我有一个例外业务规则需要查询:如果员工的最后一个日期是星期五,而下一个开始日期是最近的星期一,它应该将这些日期分组到同一个“孤岛”,而不增加天数。以下是我对示例数据集的意思:Sql 连续日期的群岛,包括缺少的周末,sql,sql-server,count,window-functions,gaps-and-islands,Sql,Sql Server,Count,Window Functions,Gaps And Islands,我有一个很大的数据集,其中包含某些操作的日期,我正在尝试计算连续的日期。我四处寻找,发现了这个:它近乎完美,它正是我想要的。不幸的是,由于我的数据集,我有一个例外业务规则需要查询:如果员工的最后一个日期是星期五,而下一个开始日期是最近的星期一,它应该将这些日期分组到同一个“孤岛”,而不增加天数。以下是我对示例数据集的意思: CREATE TABLE Actions ([Employee] varchar(2), [ActionDate] date) ; IN
CREATE TABLE Actions
([Employee] varchar(2), [ActionDate] date)
;
INSERT INTO Actions
([Employee], [ActionDate])
VALUES
('AA', '2019-01-03'),
('AA', '2019-01-04'),
('AA', '2019-01-07'),
('AA', '2019-01-08'),
('BB', '2019-08-01'),
('BB', '2019-08-02'),
('BB', '2019-08-03'),
('BB', '2019-08-04'),
('BB', '2019-08-05'),
('BB', '2019-08-06'),
('CC', '2019-09-09'),
('CC', '2019-09-10'),
('CC', '2019-09-11'),
('CC', '2019-09-12'),
('CC', '2019-09-13'),
('CC', '2019-09-16'),
('CC', '2019-09-17'),
('CC', '2019-09-18')
;
我找到的查询更改了列以匹配示例:
WITH
days As
(
SELECT Employee,
ActionDate,
DATEADD(dd, -ROW_NUMBER() OVER (PARTITION BY Employee ORDER BY Employee, ActionDate), ActionDate) As grouping
FROM Actions
GROUP BY Employee, ActionDate
)
SELECT Employee,
MIN(ActionDate) AS ActionStart,
MAX(ActionDate) As ActionEnd,
DATEDIFF(dd,MIN(ActionDate),MAX(ActionDate))+1 As ActLength
FROM days
GROUP BY Employee, grouping
ORDER BY Employee, ActionStart
结果如下:
+-------+----------+-------------+------------+-----------+
| RowNr | Employee | ActionStart | ActionEnd | ActLength |
+-------+----------+-------------+------------+-----------+
| 1 | AA | 03.01.2019 | 04.01.2019 | 2 |
| 2 | AA | 07.01.2019 | 08.01.2019 | 2 |
| 3 | BB | 01.08.2019 | 06.08.2019 | 6 |
| 4 | CC | 09.09.2019 | 13.09.2019 | 5 |
| 5 | CC | 16.09.2019 | 18.09.2019 | 3 |
+-------+----------+-------------+------------+-----------+
在此示例中,员工AA的结束日期为2019年1月4日星期五,而2019年1月7日的开始日期为最近的星期一。CC还有一个截止日期为2019年9月13日星期五,下一个开始日期为最近的2019年9月16日星期一。它应该“组合”这些日期,而不增加ActLength。因此,预期的结果将是:
+-------+----------+-------------+------------+-----------+
| RowNr | Employee | ActionStart | ActionEnd | ActLength |
+-------+----------+-------------+------------+-----------+
| 1 | AA | 03.01.2019 | 08.01.2019 | 4 |
| 2 | BB | 01.08.2019 | 06.08.2019 | 6 |
| 3 | CC | 09.09.2019 | 18.09.2019 | 8 |
+-------+----------+-------------+------------+-----------+
有人知道可以为这种SQL查询创建这样的规则吗?我试着四处看看,通常人们都想把周末排除在外。非常感谢大家。我发现使用
lag()
和窗口求和更容易实现您想要的逻辑:
select employee, min(actionDate) actionStart, max(actionDate) actionEnd, count(*) actionLength
from (
select
a.*, sum(
case when actionDate = dateadd(day, 1, lagActionDate)
or (actionDate = dateadd(day, 3, lagActionDate) and datename(weekday, actionDate) = 'Monday')
then 0 else 1 end
) over(partition by employee order by actionDate) grp
from (
select
a.*,
lag(actionDate) over(partition by employee order by actionDate) lagActionDate
from actions a
) a
) a
group by employee, grp
:
employee | actionStart | actionEnd | actionLength
:------- | :---------- | :--------- | -----------:
AA | 2019-01-03 | 2019-01-08 | 4
BB | 2019-08-01 | 2019-08-06 | 6
CC | 2019-09-09 | 2019-09-18 | 8
员工|动作开始|动作结束|动作长度
:------- | :---------- | :--------- | -----------:
AA | 2019-01-03 | 2019-01-08 | 4
BB | 2019-08-01 | 2019-08-06 | 6
CC | 2019-09-09 | 2019-09-18 | 8
我建议使用带有WK参数的DATEPART,这意味着你将得到周数-这就是你将如何在一周内分组,将考虑下星期一星期五的情况。