Python 3.x 使用ID列表只抓取推文元数据,而不抓取推文文本
上下文:我有一个tweet ID及其文本内容的列表,我需要抓取它们的元数据。但是,我的代码也会抓取tweet元数据和文本。因为我有大约10万个推特ID,我不想再浪费时间抓取推特文本 问题:我如何调整以下代码,以便只下载tweet元数据。我正在使用tweepy和python 3.6Python 3.x 使用ID列表只抓取推文元数据,而不抓取推文文本,python-3.x,twitter,metadata,tweepy,Python 3.x,Twitter,Metadata,Tweepy,上下文:我有一个tweet ID及其文本内容的列表,我需要抓取它们的元数据。但是,我的代码也会抓取tweet元数据和文本。因为我有大约10万个推特ID,我不想再浪费时间抓取推特文本 问题:我如何调整以下代码,以便只下载tweet元数据。我正在使用tweepy和python 3.6 def get_tweets_single(twapi, idfilepath): #tweet_id = '522778758168580098' tw_list = [] with open
def get_tweets_single(twapi, idfilepath):
#tweet_id = '522778758168580098'
tw_list = []
with open(idfilepath,'r') as f1:#A File that Contains tweet IDS
lines = f1.readlines()
for line in lines:
try:
print(line.rstrip('\n'))
tweet = twapi.get_status(line.rstrip('\n'))#tweepy function to crawl tweet metadata
tw_list.append(tweet)
#tweet = twapi.statuses_lookup(id_=tweet_id,include_entities=True, trim_user=True)
with open(idjsonFile,'a',encoding='utf-8')as f2:
json.dump(tweet._json,f2)
except tweepy.TweepError as te:
print('Failed to get tweet ID %s: %s', tweet_id, te.message)
def main(args):
print('hello')
# connect to twitter
auth = tweepy.OAuthHandler(CONSUMER_KEY, CONSUMER_SECRET)
auth.set_access_token(OAUTH_TOKEN, OAUTH_TOKEN_SECRET)
api = tweepy.API(auth)
get_tweets_single(api, idfilepath)
您不能只下载关于tweet的元数据
查看时,您可以选择使用trim\u user=true
排除有关用户的信息,但这是您唯一可以删除的内容