Twitter 每天获得尽可能多的推文';尽可能地改变趋势

Twitter 每天获得尽可能多的推文';尽可能地改变趋势,twitter,tweets,Twitter,Tweets,我每30分钟在一个数据库中存储一次Twitter上某个国家的热门话题。没问题。 现在,我想得到尽可能多的tweet来匹配那些研究目的的热门话题 因为我想研究趋势的模式,所以我希望在检测到趋势峰值的那一天,针对每个趋势主题,至少有3天的连续推特数据。为了实现这一目标,我考虑采取以下措施: 假设我在第X天,我可以检索到第X-2天的独特趋势,对于每个趋势,在[X-3,X-1]的时间间隔内(即3天)查找与趋势匹配的推文。然而,这里的问题是Twitter的速率限制。如果我在第X-2天有100个趋势主题,并

我每30分钟在一个数据库中存储一次Twitter上某个国家的热门话题。没问题。 现在,我想得到尽可能多的tweet来匹配那些研究目的的热门话题

因为我想研究趋势的模式,所以我希望在检测到趋势峰值的那一天,针对每个趋势主题,至少有3天的连续推特数据。为了实现这一目标,我考虑采取以下措施:

假设我在第X天,我可以检索到第X-2天的独特趋势,对于每个趋势,在[X-3,X-1]的时间间隔内(即3天)查找与趋势匹配的推文。然而,这里的问题是Twitter的速率限制。如果我在第X-2天有100个趋势主题,并且我提出了20个GET搜索请求/趋势,我最终会提出总共2000个请求,这超过了Twitter每小时350次的限制。如果每小时发出300个请求,则只需一天的时间就可以获得6个多小时的数据

有人知道其他(更好的)方法来获取与趋势相关的推文吗

提前感谢

推特流媒体API? 推特流媒体API不提供任何过去的推特。您只能从建立服务器连接时开始接收推文。理论上,搜索API将返回与当前查询匹配的tweet,最长可达7天,但这完全取决于Twitter当前的负载。(注意*-此时间间隔有时短至24小时。此外,无论推文的年龄有多大,您最多只能接收1500条推文。)

有没有办法从流媒体获取更多推文? 我不知道。但是,如果您正在考虑在搜索或流式API之间切换,请务必参考以下信息

请选择您的案例:

  • 如果您需要实时数据且请求数量很大:
选择流媒体API

流式API要求您保持连接处于活动状态。这需要一个具有无限循环的服务器进程来获取最新的tweet

优势

1) 检索结果的延迟:使用这种方法发送的tweet基本上是实时的,从发布tweet到从API接收tweet之间最多有一到两秒钟的延迟

2) 不限收费

  • 如果您需要聚合数据,而不考虑其时间范围,并且您的请求数量不高:
搜索API

搜索API是两种方法中较容易实现的,但它的速率有限。每个请求将返回最多100条tweet,并且您可以使用页面参数请求最多15条页面,理论上一次查询最多可发送1500条tweet

优势

1) 查找过去的推文:搜索API默认在该区域获胜,因为流式API不提供任何过去的推文


2) 更易于实施

请不要发布重复的答案。如果两个(或更多)问题确实可以用完全相同的答案(至少如此大小)来回答,那么它们是重复的,否则答案(至少其中一些)是不合适的。相反,根据手头的具体问题定制每个答案。谢谢你的回答。由于我需要获得与过去趋势相对应的过去数据,所以我当然不使用流式API。因此,问题将是如何使用搜索API最大限度地提高检索到的tweet数量,因为速率限制。。。我现在正在做的是获取推文、睡眠、继续获取推文、睡眠等。这是可行的,但一定有更好的选择……。@LasseV.Karlsen我认为答案对两者都有帮助,所以粘贴。谢谢您提供的信息。下次我们将共享此链接。