Sql BigQuery拆分列并获取每个子字符串的计数

Sql BigQuery拆分列并获取每个子字符串的计数,sql,google-bigquery,Sql,Google Bigquery,在BigQuery中,我想创建一个查询来统计注释字段中单词的出现次数,并根据每次出现的次数进行分组。这将让我了解哪些词比其他词使用得更多,并了解用户的行为和情绪。bigquery非常新,所以任何想法都会很有帮助 我最后做的是使用split函数 SELECT COUNT(JJ) AS STUFF, JJ FROM (SELECT SPLIT(text, ' ') AS JJ FROM [bigquery-public- data:hacker_news.comments] LIMIT 1000

在BigQuery中,我想创建一个查询来统计注释字段中单词的出现次数,并根据每次出现的次数进行分组。这将让我了解哪些词比其他词使用得更多,并了解用户的行为和情绪。bigquery非常新,所以任何想法都会很有帮助

我最后做的是使用split函数

SELECT 
COUNT(JJ) AS STUFF, JJ
FROM
(SELECT SPLIT(text, ' ') AS JJ FROM [bigquery-public-
data:hacker_news.comments] LIMIT 1000 ) 
GROUP BY JJ
ORDER BY STUFF DESC
LIMIT 5

显然,在拆分之前,可以通过使用“替换”删除其他字符来对其进行更多操作。

这里的主要思想是——首先自己尝试一些东西,如果有任何特殊/特定的问题,请提交给我们,我们将乐于提供帮助。那么,到目前为止你试过什么?有什么疑问吗?你有没有尝试过搜索类似的或确切的问题?啊,是的,我还没有写权限…我正在查看mysql,我确实可以访问它,但它似乎依赖于子字符串,所以我想我必须先计算分隔符的数量,然后得到N个出现次数…我想我可以使用explode(拆分(字段“”)作为word,将每个单词分开。希望我能很快获得写入权限。谢谢我迷路了-你是在使用mysql还是bigquery?!你不需要拥有写入权限就可以播放和运行simple query:o),这样你就可以启动bigquery了。是的,我不好,我打算用免费帐户建立一个帐户,但不知怎么的,我忘记了使用另一个帐户的选项。我想我没有看到这一点…它帮助了很多。考虑到这一点,我意识到我们没有使用Leqacy sql,这正是我的解决方案所依赖的。