Sql Postgres计算行数并按时间戳对它们进行分组

Sql Postgres计算行数并按时间戳对它们进行分组,sql,postgresql,Sql,Postgresql,假设postgres中有一个表,只有两列: ID这是表的主键(bigint) 时间是时间戳的类型 有没有办法让ID按时间按年份分组-当时间为2005年2月18日时,它将适合于2005年组(因此结果将是) 和如果结果行数小于某个数字(例如3),SQL将按月返回结果 差不多 month number of rows (February 2018) 5 (March 2018) 2 在postgres SQL中,这可能是一种很好的方法吗?您可以使用窗口函数(一如既

假设postgres中有一个表,只有两列:

  • ID
    这是表的主键(
    bigint
  • 时间
    是时间戳的类型
有没有办法让ID按时间按年份分组-当时间为2005年2月18日时,它将适合于2005年组(因此结果将是)

如果结果行数小于某个数字(例如3),SQL将按月返回结果

差不多

month            number of rows
(February 2018)  5
(March 2018)     2

在postgres SQL中,这可能是一种很好的方法吗?

您可以使用窗口函数(一如既往)来实现这一点

我使用这个表格:

TABLE times;

 id |               t               
----+-------------------------------
  1 | 2018-03-14 20:04:39.81298+01
  2 | 2018-03-14 20:04:42.92462+01
  3 | 2018-03-14 20:04:45.774615+01
  4 | 2018-03-14 20:04:48.877038+01
  5 | 2017-03-14 20:05:08.94096+01
  6 | 2017-03-14 20:05:16.123736+01
  7 | 2017-03-14 20:05:19.91982+01
  8 | 2017-01-14 20:05:32.249175+01
  9 | 2017-01-14 20:05:35.793645+01
 10 | 2017-01-14 20:05:39.991486+01
 11 | 2016-11-14 20:05:47.951472+01
 12 | 2016-11-14 20:05:52.941504+01
 13 | 2016-10-14 21:05:52.941504+02
(13 rows)
首先,按月分组(每个月的子查询
)。
然后使用窗口函数(子查询
和_year
)添加每年的总和。
最后,使用
CASE
决定输出哪一个,并使用
DISTINCT
删除重复项

SELECT DISTINCT
   CASE WHEN yc > 5
        THEN mc
        ELSE yc
   END AS count,
   CASE WHEN yc > 5
        THEN to_char(t, 'YYYY-MM')
        ELSE to_char(t, 'YYYY')
   END AS period
FROM (SELECT
         mc,
         sum(mc) OVER (PARTITION BY date_trunc('year', t)) AS yc,
         t
      FROM (SELECT
               count(*) AS mc,
               date_trunc('month', t) AS t
            FROM times
            GROUP BY date_trunc('month', t)
           ) per_month
     ) with_year
ORDER BY 2;

 count | period  
-------+---------
     3 | 2016
     3 | 2017-01
     3 | 2017-03
     4 | 2018
(4 rows)

只要数几年。如果至少为3,则按年分组,否则按月分组:

select
  case (select count(distinct extract(year from time)) from mytable) >= 3 then
    to_char(time, 'yyyy')
  else
    to_char(time, 'yyyy-mm')
  end as season,
  count(*)
from mytable
group by season
order by season;

(与许多其他DBMS不同,PostgreSQL允许在
GROUP BY
子句中使用别名。)

不容易(其他海报,请随意更正)。这在SQL之外的表示层中更容易处理。您的SQL查询将按月将结果传递给您用于显示此数据的任何工具,该工具将决定如何显示它(通过将其分组为年份或按月显示单个数据)。好的,谢谢您的回答。但是我怎么能在博士后的一年里取得这样的成绩呢?(然后我可以在PHP中检查我得到了多少行,并在几个月内运行SQL)谷歌在Postgres问题上运行得非常好。谷歌“Postgres年仅从stackoverflow日期开始”。此处所指的答案如下:选择摘录(从时间戳'2001-02-16 20:38:40'开始的年份),将时间戳'2001-02-16 20:38:40'更改为字段名。链接中有与您可能需要的任何其他日期摘录非常接近的说明。@12th:请不要发布到完全过时的Postgres版本的链接。最好用
current
:Hello替换URL中的版本号。它的工作原理很有魅力,但我有一个小问题。我不得不修改您的代码,如r.added在'2018-03-10'::timestamp和'2018-03-19'::timestamp之间添加在peru_month子查询中,因为我有时只想获得某个时间间隔内的条目的这些统计信息。(所以我想得到2016-05年到2017-05年的参赛作品的时间记录——结果是2016-05年5月、2017-5年等)我在那里添加了where子句,但脚本每次只返回一条记录。我该如何修改它呢?也许那个附加子句会过滤掉除一年(或一个月)之外的所有行?尝试只运行内部查询和检查。
select
  case (select count(distinct extract(year from time)) from mytable) >= 3 then
    to_char(time, 'yyyy')
  else
    to_char(time, 'yyyy-mm')
  end as season,
  count(*)
from mytable
group by season
order by season;