如何使用Python中的正则表达式从有关激进主义/抗议的推文中提取位置信息?

如何使用Python中的正则表达式从有关激进主义/抗议的推文中提取位置信息?,python,regex,twitter,nlp,Python,Regex,Twitter,Nlp,为了研究社区组织的现代时代,我正在使用从推特活动家社区收集的语料库。我正试图通过re.findall运行这些数据,以确定关注位置的tweet。我认为使用关键字“at”可能是实现这一点最简单的方法 基本上,如果整个tweet是(例如)“所有想要加入的人,下午3点在市政厅见面”,我的代码应该打印出类似于“在市政厅见面”的内容。这是可能的,还是我从根本上误解了正则表达式的实用性?我以前只在提取电子邮件信息时使用过它们,所以我习惯于编写如下代码: match = re.findall(r'[\w\.-]

为了研究社区组织的现代时代,我正在使用从推特活动家社区收集的语料库。我正试图通过re.findall运行这些数据,以确定关注位置的tweet。我认为使用关键字“at”可能是实现这一点最简单的方法

基本上,如果整个tweet是(例如)“所有想要加入的人,下午3点在市政厅见面”,我的代码应该打印出类似于“在市政厅见面”的内容。这是可能的,还是我从根本上误解了正则表达式的实用性?我以前只在提取电子邮件信息时使用过它们,所以我习惯于编写如下代码:

match = re.findall(r'[\w\.-]+@[\w\.-]+', line)
但是,尝试将上述代码中的“@”替换为“at”不会产生任何结果


我可能连问对的问题都没有。对于我造成的任何混乱,我深表歉意,并感谢所有的帮助

如果我理解正确,你只是想用“at”或“@”来匹配一个句子

这是我想出的正则表达式:

r'[\w\s]+(at|@)[\w\s]+\.?'
这将匹配“at”或“@”前后的任何单词


供将来参考:下次创建正则表达式时,请使用。我发现它很有用

首先,必须在正则表达式模式中包含“at”前后的空格。