Sql tweets字符串中remove@ImSRK的大查询
我正在用谷歌云在推特上做情绪分析。在我的大桌子里,我收到了成千上万人的推特。我想从推文中删除@NarendraModi。你能帮我找到一个大问题吗。例如 @纳伦德拉莫迪先生,祝贺你Sql tweets字符串中remove@ImSRK的大查询,sql,google-bigquery,Sql,Google Bigquery,我正在用谷歌云在推特上做情绪分析。在我的大桌子里,我收到了成千上万人的推特。我想从推文中删除@NarendraModi。你能帮我找到一个大问题吗。例如 @纳伦德拉莫迪先生,祝贺你 在上面的推文中,我想从字符串中删除@narendramodi。在下面使用REPLACE或REGEXP\u REPLACE的BigQuery标准SQL示例的@Narendramodi后面有一个空格 #standardSQL WITH `project.dataset.table` AS ( SELECT '@Nare
在上面的推文中,我想从字符串中删除@narendramodi。在下面使用REPLACE或REGEXP\u REPLACE的BigQuery标准SQL示例的@Narendramodi后面有一个空格
#standardSQL
WITH `project.dataset.table` AS (
SELECT '@NarendraModi congratulation sir' tweet
)
SELECT REPLACE(tweet, '@NarendraModi ', ''),
REGEXP_REPLACE(tweet, r'@NarendraModi\s*', ''),
REGEXP_REPLACE(tweet, r'@\w+\s+', '')
FROM `project.dataset.table`
输出是
Row f0_ f1_ f2_
1 congratulation sir congratulation sir congratulation sir
我还剩下两个模式1)“somename:”和2)“somename。”
下面讨论其他模式
#standardSQL
WITH `project.dataset.table` AS (
SELECT '@NarendraModi congratulation sir' tweet UNION ALL
SELECT '@NarendraModi. congratulation sir' tweet UNION ALL
SELECT '@NarendraModi: congratulation sir' tweet
)
SELECT REGEXP_REPLACE(tweet, r'@\w+[:.\s]*', '')
FROM `project.dataset.table`
结果
Row f0_
1 congratulation sir
2 congratulation sir
3 congratulation sir
我有很多不同的tweet,比如@narendramodi,这与你最初的问题不太清楚-不管怎样-我刚刚添加了第三行,可以替换任何@xyz@Mikhali Berlyant。我在大查询谷歌云平台上运行这个查询。我的答案是针对大查询!如果您认为它对您不起作用-请具体说明什么和如何不起作用,以便我们可以进一步帮助您。您好,很抱歉浪费您的时间。我做错了。我忘了写正则表达式。现在很有魅力。万分感谢!!