Google bigquery BigQuery Reddit数据集:从子Reddit收集注释?
一般来说,BigQuery和SQL非常新!我在网上找到了这个很棒的Reddit评论数据集(),我想对这些评论做一些定性分析 问题:我如何将搜索范围缩小到仅检索r/cancer子项和r/diabetes子项中的注释和时间戳?我应该使用的确切查询是什么? 我知道这可能真的很容易,但我在这上面花了4-5个小时,仍然无法理解Google bigquery BigQuery Reddit数据集:从子Reddit收集注释?,google-bigquery,reddit,Google Bigquery,Reddit,一般来说,BigQuery和SQL非常新!我在网上找到了这个很棒的Reddit评论数据集(),我想对这些评论做一些定性分析 问题:我如何将搜索范围缩小到仅检索r/cancer子项和r/diabetes子项中的注释和时间戳?我应该使用的确切查询是什么? 我知道这可能真的很容易,但我在这上面花了4-5个小时,仍然无法理解 SELECT subreddit, COUNT(*) c FROM [fh-bigquery:reddit_comments.2015_05] WHERE subreddit I
SELECT subreddit, COUNT(*) c
FROM [fh-bigquery:reddit_comments.2015_05]
WHERE subreddit IN ('cancer', 'diabetes')
GROUP BY 1
LIMIT 1000
Query complete (1.6s elapsed, 595 MB processed)
Row subreddit c
1 diabetes 6508
2 cancer 1923
对于原始注释和时间戳:
SELECT subreddit, created_utc, body
FROM [fh-bigquery:reddit_comments.2015_05]
WHERE subreddit IN ('cancer', 'diabetes')
LIMIT 10
成功了,菲利佩!非常感谢你在这方面的帮助!我真的很感激!