Python 从tweet中提取url、提及和hashtag

Python 从tweet中提取url、提及和hashtag,python,url,twitter,slice,hashtag,Python,Url,Twitter,Slice,Hashtag,我正在尝试提取所有非字母数字的字符,并使用python从tweet中提取url。我应该只留下用空格隔开的单词。 例如: 如果我的tweet是:“嗨!查看我在@python#python上的页面” 我应该得到:“嗨,请查看我的网页” 谢谢你的帮助 假设您已经获得了tweet文本,那么在字符串上使用python的一些内置操作应该能够完成您想要的操作。下面是一个使用列表理解和 在您的示例中存在不一致性,您希望包括'hi',但删除两个'phyton',即使字符串'hi!'包括非字母数字字符。你包括字符串

我正在尝试提取所有非字母数字的字符,并使用python从tweet中提取url。我应该只留下用空格隔开的单词。 例如: 如果我的tweet是:“嗨!查看我在@python#python上的页面” 我应该得到:“嗨,请查看我的网页”
谢谢你的帮助

假设您已经获得了tweet文本,那么在字符串上使用python的一些内置操作应该能够完成您想要的操作。下面是一个使用列表理解和


在您的示例中存在不一致性,您希望包括'hi',但删除两个'phyton',即使字符串'hi!'包括非字母数字字符。你包括字符串“Hi”是因为它不是像“phyton”那样的标记吗?是的,我包括Hi是因为它不是标记,它是一个单词,但我正在去掉所有的标点符号
import string

my_tweet = "Hi! Check out my page at https://www.tutorialspoint.com/python/python_strings.htm @phyton #phyton"
tweet_text = ' '.join([i.lower() for i in my_tweet.split() if not i.startswith(('http', '@', '#'))]).translate(None, string.punctuation)
print tweet_text # hi check out my page at