Sql 使用4个表获取数据

Sql 使用4个表获取数据,sql,postgresql,Sql,Postgresql,我有以下表格: trendingtopic id name trendingtopiccycle id trendingtopic_id(FK) tweet id text tt_cycle_id(FK) user_id(FK) user id rank 我想知道是否有一种方法可以有效地检索每个热门话题的排名较高的用户的推文 以下是我当前的查询: SELECT tt."name", MAX(tu."actual_rank") AS ran

我有以下表格:

trendingtopic
  id
  name

trendingtopiccycle
  id
  trendingtopic_id(FK)

tweet
  id 
  text
  tt_cycle_id(FK)
  user_id(FK)

user
  id
  rank
我想知道是否有一种方法可以有效地检索每个热门话题的排名较高的用户的推文

以下是我当前的查询:

  SELECT tt."name",
  MAX(tu."actual_rank") AS rank,tu."name"
  FROM "trendingtopics_twitteruser" tu
  LEFT JOIN "trendingtopics_tweet" tw ON tu."id" = tw."user_id" 
  LEFT JOIN "trendingtopics_trendingtopiccycle" ttc ON tw."tt_cycle_id" = ttc."id"
  LEFT JOIN "trendingtopics_trendingtopic" tt ON ttc."tt_id" = tt."id" 
  GROUP BY tt."name"
它不起作用,因为根据Postgresql:““tu.name”必须出现在GROUP BY子句中或用于聚合函数”

如果我将tu.“name”添加到GROUPBY子句中,我将得到如下结果:

"106 & Park";0;"910Prince"
"106 & Park";0;"ActressAlexiss"
"106 & Park";0;"AmeliaThirlwall"
"106 & Park";0;"_ArielIvy"
"106 & Park";0;"_AyyeVce"
"106 & Park";0;"barcastuff"
"106 & Park";0.42141;"pareexo"
"106 & Park";0.0363;"khleosupporters"
"#15ThingsAboutMyCrush";0;"_ALoyalLady"
"#15ThingsAboutMyCrush";0.22275;"AmberrNikole"
"#15ThingsAboutMyCrush";0;"a_paigeturner"
"#15ThingsAboutMyCrush";0.33942018;"ArleneAndrea_xo"
但我想得到的是:

"106 & Park";0.42141;"pareexo"
"#15ThingsAboutMyCrush";0.33942018;"ArleneAndrea_xo"

实际上,在子查询中使用窗口函数很容易做到这一点:

SELECT t."topic_name", t."rank", t."user_name"
FROM 
    (SELECT tt."name" AS topic_name, tu."actual_rank" AS rank, tu."name" AS user_name,
        row_number() OVER (PARTITION BY tt."name" ORDER BY tu."actual_rank" DESC) user_rank
    FROM "trendingtopics_trendingtopic" tt
    LEFT JOIN "trendingtopics_trendingtopiccycle" ttc ON ttc."tt_id" = tt."id"
    LEFT JOIN "trendingtopics_tweet" tw ON tw."tt_cycle_id" = ttc."id"
    LEFT JOIN "trendingtopics_twitteruser" tu ON tu."id" = tw."user_id") t
WHERE t."user_rank" = 1
此外,我重新排列了连接顺序,以便您从趋势主题开始,而不是从twitter用户开始。因为您试图为趋势主题获取排名最高的用户,所以(至少对我来说)从源表开始就更有意义

有关窗口函数和分区的更多信息,请转到此处:

最快的解决方案可能是在上使用
DISTINCT,而不是使用窗口函数

SELECT DISTINCT ON (tt."name")
    tt."name", tu."actual_rank" AS rank, tu."name"
  FROM "trendingtopics_twitteruser" tu
  LEFT JOIN "trendingtopics_tweet" tw ON tu."id" = tw."user_id" 
  LEFT JOIN "trendingtopics_trendingtopiccycle" ttc ON tw."tt_cycle_id" = ttc."id"
  LEFT JOIN "trendingtopics_trendingtopic" tt ON ttc."tt_id" = tt."id" 
  ORDER BY tt."name", tu."actual_rank" DESC;

顺便说一下,这是未经测试的,因为您没有提供语句来实际创建和加载所描述的表。如果你在问题中提供了这类内容,人们通常会在发帖前测试他们的答案,你就不会有愚蠢的错误需要处理。

@mfalcom:这是sql的基础,非聚合列应该在group by子句中,因此你必须在group by子句中添加
tu.name
,我已经更新了这篇文章的更多信息。你使用的是哪个版本的Postgresql?哦,如果你想联系某人,请在他/她的名字前面加上@符号。@NikolaMarkovinović:我使用的是9.1版本。这只是偶然的。OP希望
tu.Name
来自包含
max(tu.Actual\u Rank)
的同一行。我尝试了该查询,但在tu附近发现了一个语法错误:“trendingtopics\u trendingtopic”tt tu中有一个工件来自我重新排列连接顺序时的工件。现在试一试。现在我得到了这个错误:列“tu.actual_rank”必须出现在GROUP BY子句中,或者在聚合函数中使用。分组不是必需的,还是来自copy/PATA的工件。再试一次。谢谢你的帮助,非常好!。我将阅读链接以完全理解查询。
SELECT DISTINCT ON (tt."name")
    tt."name", tu."actual_rank" AS rank, tu."name"
  FROM "trendingtopics_twitteruser" tu
  LEFT JOIN "trendingtopics_tweet" tw ON tu."id" = tw."user_id" 
  LEFT JOIN "trendingtopics_trendingtopiccycle" ttc ON tw."tt_cycle_id" = ttc."id"
  LEFT JOIN "trendingtopics_trendingtopic" tt ON ttc."tt_id" = tt."id" 
  ORDER BY tt."name", tu."actual_rank" DESC;