使用python,如何在两个日期之间使用collect tweets(使用tweepy)?

使用python,如何在两个日期之间使用collect tweets(使用tweepy)?,python,twitter,tweepy,tweets,Python,Twitter,Tweepy,Tweets,如何使用python和tweepy从twitter收集两个给定日期之间的推文 有没有办法从…到。。。搜索api的值 注: 我需要能够搜索回来,但不限于一个特定的用户 我正在使用python,我知道代码应该是这样的,但我需要帮助才能让它工作 auth = tweepy.OAuthHandler(consumer_key, consumer_secret) auth.set_access_token(access_token_key, access_token_secret) ap

如何使用python和tweepy从twitter收集两个给定日期之间的推文

有没有办法从…到。。。搜索api的值


注: 我需要能够搜索回来,但不限于一个特定的用户

我正在使用python,我知道代码应该是这样的,但我需要帮助才能让它工作

auth = tweepy.OAuthHandler(consumer_key, consumer_secret) auth.set_access_token(access_token_key, access_token_secret) api = tweepy.API(auth) collection = [] for tweet in tweepy.Cursor(api.search, ???????).items(): collection[tweet.id] = tweet._json auth=tweepy.OAuthHandler(使用者密钥,使用者密钥) 授权设置访问令牌(访问令牌密钥、访问令牌密钥) api=tweepy.api(auth) 集合=[] 对于tweepy.Cursor(api.search,???).items()中的tweet: 集合[tweet.id]=tweet.\u json
您必须使用max_id参数,如中所述

tweepy是twitterAPI的包装器,因此您应该能够使用此参数


根据地理位置,查看。它使用相同的搜索API和自定义键。

您必须使用max_id参数,如中所述

tweepy是twitterAPI的包装器,因此您应该能够使用此参数


根据地理位置,查看。它使用相同的搜索API,带有定制的密钥。

经过长时间的调查和稳定,我可以很高兴地分享我的发现。

  • 按地理编码搜索:按以下格式传递“q”参数中的地理编码参数:地理编码:“37.781157,-122.398720500mi”,双引号很重要。请注意,此api不再支持参数near。地理代码提供了更大的灵活性

  • 按时间线搜索:使用以下格式的参数“自”和“至”:自:2016-08-01至:2016-08-02

还有一个更重要的提示。。。twitter不允许使用太旧的日期进行查询。我不确定,但我认为他们只给10-14天的时间。所以你不能用这种方式查询上个月的推文

===================================

for status in tweepy.Cursor(api.search,
                       q='geocode:"37.781157,-122.398720,1mi" since:2016-08-01 until:2016-08-02 include:retweets',
                       result_type='recent',
                       include_entities=True,
                       monitor_rate_limit=False, 
                       wait_on_rate_limit=False).items(300):
    tweet_id = status.id
    tweet_json = status._json

经过长时间的调查和稳定,我可以很高兴地分享我的发现。

  • 按地理编码搜索:按以下格式传递“q”参数中的地理编码参数:地理编码:“37.781157,-122.398720500mi”,双引号很重要。请注意,此api不再支持参数near。地理代码提供了更大的灵活性

  • 按时间线搜索:使用以下格式的参数“自”和“至”:自:2016-08-01至:2016-08-02

还有一个更重要的提示。。。twitter不允许使用太旧的日期进行查询。我不确定,但我认为他们只给10-14天的时间。所以你不能用这种方式查询上个月的推文

===================================

for status in tweepy.Cursor(api.search,
                       q='geocode:"37.781157,-122.398720,1mi" since:2016-08-01 until:2016-08-02 include:retweets',
                       result_type='recent',
                       include_entities=True,
                       monitor_rate_limit=False, 
                       wait_on_rate_limit=False).items(300):
    tweet_id = status.id
    tweet_json = status._json

到目前为止,Tweepy并不是最好的解决方案。最好的解决方案是使用python库SnScrape,它可以刮除twitter,因此可以在twitter设置2周上限后获得tweet。下面的代码只在日期之间抓取100条英语推文,并且只获取推文ID,但是它可以很容易地扩展为更具体的搜索、更多或更少的推文,或者获取关于推文的更多信息

将snscrap.modules.twitter导入为sntwitter
tweetslist=[]
params=“”“+”lang:en“+”自:2020-11-1“+”至:2021-03-13“+”“
对于i,在enumerate中tweet(sntwitter.TwitterSearchScraper(params.get_items()):
如果i>100:
打破
tweetslist.append([tweet.id])

打印(tweetslist)
到目前为止,Tweepy不是最好的解决方案。最好的解决方案是使用python库SnScrape,它可以刮除twitter,因此可以在twitter设置2周上限后获得tweet。下面的代码只在日期之间抓取100条英语推文,并且只获取推文ID,但是它可以很容易地扩展为更具体的搜索、更多或更少的推文,或者获取关于推文的更多信息

将snscrap.modules.twitter导入为sntwitter
tweetslist=[]
params=“”“+”lang:en“+”自:2020-11-1“+”至:2021-03-13“+”“
对于i,在enumerate中tweet(sntwitter.TwitterSearchScraper(params.get_items()):
如果i>100:
打破
tweetslist.append([tweet.id])

打印(tweetslist)
我必须在搜索中添加,我也不想限制到一个特定的单词或标签,我需要进行开放式搜索。我必须在搜索中添加,我也不想限制到一个特定的单词或标签,我需要进行开放式搜索。谢谢。我将回顾事实上我熟悉这些,甚至根据它们的说明编写了一个代码,但我在运行它和获得正确答案时遇到了一些问题。我将回顾事实上我熟悉这些,甚至根据他们的指示编写了一个代码,但我有一些问题要运行它并得到正确的答案,我们可以在Twitter上返回一段有限的时间。免费帐户,7天。还有30天的付费帐户。我们可以在Twitter上停留一段有限的时间。免费帐户,7天。保险费账户的有效期为30天。