Twitter 通过tweeterapi收集旧tweet

Twitter 通过tweeterapi收集旧tweet,twitter,tweepy,twitter-streaming-api,twython,python-twitter,Twitter,Tweepy,Twitter Streaming Api,Twython,Python Twitter,我打算收集关于3年前发生的事件的推文,但我在某个地方读到推文只允许其API用户收集不超过一周的推文。因此,我想问,如果这是真的,我如何收集3年或更长时间前的推文?使用以下方式获取推文: time_line_statuses = api.GetUserTimeline(screen_name=screen_name, include_rts=True) 使用for循环通过时间线状态循环 检查每个项目的“created_at”属性,查看其是否比截止日期早 每个项目都有一个“id”属性。价值似乎随着

我打算收集关于3年前发生的事件的推文,但我在某个地方读到推文只允许其API用户收集不超过一周的推文。因此,我想问,如果这是真的,我如何收集3年或更长时间前的推文?

使用以下方式获取推文:

time_line_statuses = api.GetUserTimeline(screen_name=screen_name, include_rts=True)
  • 使用for循环通过时间线状态循环
  • 检查每个项目的“created_at”属性,查看其是否比截止日期早
  • 每个项目都有一个“id”属性。价值似乎随着时间而增长。较低ID=较老
  • 将时间线状态中最早状态的“id”存储为最早状态id
  • 召唤
  • 最旧的\u id存储为以前的\u最旧的\u id

  • 重复1-6,同时检查最早的\u id是否不等于以前的\u最早的\u id,然后继续循环

  • 你每小时只能向twitter发出100个get请求。您需要计算Get()调用的次数,并在达到该限制时让程序睡眠一小时。我不知道他们的API是否对它可以追溯到什么时候有限制。如果您可以找到截止日期开始时的tweet ID并从那里开始此过程,则可以保存API调用。

    使用以下方法获取tweet:

    time_line_statuses = api.GetUserTimeline(screen_name=screen_name, include_rts=True)
    
  • 使用for循环通过时间线状态循环
  • 检查每个项目的“created_at”属性,查看其是否比截止日期早
  • 每个项目都有一个“id”属性。价值似乎随着时间而增长。较低ID=较老
  • 将时间线状态中最早状态的“id”存储为最早状态id
  • 召唤
  • 最旧的\u id存储为以前的\u最旧的\u id

  • 重复1-6,同时检查最早的\u id是否不等于以前的\u最早的\u id,然后继续循环


  • 你每小时只能向twitter发出100个get请求。您需要计算Get()调用的次数,并在达到该限制时让程序睡眠一小时。我不知道他们的API是否对它可以追溯到什么时候有限制。如果您可以找到截止日期开始时的tweet ID并从那里开始此过程,则可以保存API调用。

    您唯一的选择是支付服务费用,例如。Gnip提供了一个API,可以让您搜索一周以上的推文。

    您唯一的选择是支付服务费用,例如。Gnip提供了一个API,允许您搜索一周以上的推文。

    如果问题是从用户时间线获取推文,这将是一个很好的答案。它不适用于获取包含与事件对应的单词或标签的tweet。如果问题是从用户时间线获取tweet,这将是一个很好的答案。它不适用于获取包含与事件对应的单词或标签的tweet。请检查此项检查此项