Postgresql-优化sql,根据每个学生的表现选择前三名科目
我有一个表格,里面有学生和他们在不同科目上的分数。同一科目有多个评估。我想按照下面的要求编写一个sql输出结果 应为每个学生选择前3个科目,并为每个科目选择2行。 选择3个得分最高的科目,第二排必须来自同一科目。 不同科目和同一科目可以有相同的分数。如果标记相同,则选择任何标记。 学生的主题可能不在一起,也可能分散在桌子上,为了便于可视化,我将它们放在一起。 表:Postgresql-优化sql,根据每个学生的表现选择前三名科目,sql,postgresql,window-functions,Sql,Postgresql,Window Functions,我有一个表格,里面有学生和他们在不同科目上的分数。同一科目有多个评估。我想按照下面的要求编写一个sql输出结果 应为每个学生选择前3个科目,并为每个科目选择2行。 选择3个得分最高的科目,第二排必须来自同一科目。 不同科目和同一科目可以有相同的分数。如果标记相同,则选择任何标记。 学生的主题可能不在一起,也可能分散在桌子上,为了便于可视化,我将它们放在一起。 表: student_id | subject | marks ------------|---------------|-
student_id | subject | marks
------------|---------------|--------------
1 | sub-1 | 10
1 | sub-1 | 50
1 | sub-1 | 25
1 | sub-1 | 50
1 | sub-10 | 2
1 | sub-10 | 85
1 | sub-10 | 40
1 | sub-3 | 10
1 | sub-3 | 5
1 | sub-3 | 55
1 | sub-3 | 65
1 | sub-3 | 70
1 | sub-4 | 90
1 | sub-4 | 50
1 | sub-4 | 25
1 | sub-6 | 20
1 | sub-6 | 70
1 | sub-6 | 35
...
所需结果:
student_id | subject | marks
------------|---------------|--------------
1 | sub-4 | 90
1 | sub-4 | 50
1 | sub-10 | 85
1 | sub-10 | 40
1 | sub-6 | 70
1 | sub-6 | 35
我可以使用下面提到的sql来解决这个问题:
with cte as
(
select * from (
select
dense_rank() over(partition by s.id order by s.marks desc) dense_rank_number,
row_number() over (partition by s.id, s.subject order by marks desc) row_num,
s.*
from
(
select d.id, d.subject, count(*)
from student d
group by d.id, d.subject
having count(*) >= 2
) t join student s on t.id = s.id and t.subject = s.subject
order by 1, 2
) t5
where t5.row_num <= 2
),
cte1 as
(select e.dense_rank_number, e.row_num,
e.id, min(e.subject) as subject, e.marks from cte e
where e.row_num = 1 and e.dense_rank_number <= 3
group by e.id, e.row_num, e.marks, e.dense_rank_number
),
cte2 as
(
select cte.*
from cte, cte1
where
cte.id = cte1.id
and cte.subject = cte1.subject
and cte.row_num != cte1.row_num
)
select * from cte1
union
select * from cte2
;
有没有更好的方法来编写这个sql?
演示可以在这里找到:
如果我理解正确,您希望每个学生都能获得三个最高分数的科目。然后你想在这门课上得到两个最高的分数。如果是,我建议:
select s.*
from (select s.*,
dense_rank() over (partition by id order by max_marks desc, subject) as seqnum_s
from (select s.*,
row_number() over (partition by id, subject order by marks desc) as seqnum,
max(marks) over (partition by id, subject) as max_marks
from student s
) s
where seqnum <= 2
) s
where seqnum_s <= 3
order by s.id, max_marks, subject, marks desc;