Google bigquery BigQuery Reddit数据集:从子Reddit收集注释?

Google bigquery BigQuery Reddit数据集:从子Reddit收集注释?,google-bigquery,reddit,Google Bigquery,Reddit,一般来说,BigQuery和SQL非常新!我在网上找到了这个很棒的Reddit评论数据集(),我想对这些评论做一些定性分析 问题:我如何将搜索范围缩小到仅检索r/cancer子项和r/diabetes子项中的注释和时间戳?我应该使用的确切查询是什么? 我知道这可能真的很容易,但我在这上面花了4-5个小时,仍然无法理解 SELECT subreddit, COUNT(*) c FROM [fh-bigquery:reddit_comments.2015_05] WHERE subreddit I

一般来说,BigQuery和SQL非常新!我在网上找到了这个很棒的Reddit评论数据集(),我想对这些评论做一些定性分析

问题:我如何将搜索范围缩小到仅检索r/cancer子项和r/diabetes子项中的注释和时间戳?我应该使用的确切查询是什么?

我知道这可能真的很容易,但我在这上面花了4-5个小时,仍然无法理解

SELECT subreddit, COUNT(*) c
FROM [fh-bigquery:reddit_comments.2015_05] 
WHERE subreddit IN ('cancer', 'diabetes')
GROUP BY 1
LIMIT 1000

Query complete (1.6s elapsed, 595 MB processed)

Row subreddit   c    
1   diabetes    6508     
2   cancer      1923     
对于原始注释和时间戳:

SELECT subreddit, created_utc, body
FROM [fh-bigquery:reddit_comments.2015_05] 
WHERE subreddit IN ('cancer', 'diabetes')
LIMIT 10

成功了,菲利佩!非常感谢你在这方面的帮助!我真的很感激!