twitter示例API提供了多少百分比的推文?

twitter示例API提供了多少百分比的推文?,api,twitter,social-networking,Api,Twitter,Social Networking,有人知道我们收到的推文数量与Twitter服务器收到的推文总数的比率是多少吗?我正在根据从示例API读取的数据进行一些分析,并希望估计Twitter服务器处理的实际工作负载。我观察到,我们从API获得的推文数量随着时间的推移而变化。所以,我认为这是一个百分比样本。任何线索都将受到高度赞赏 感谢(基本上是老式的流媒体API)发布时,它大概占所有推文的1-2%。基于我对当前流式API的使用,如果它现在超过1%,甚至可能更少,我会感到惊讶。根据这些文档的说法,“但是他们忽略了API输出的音量是否与实际

有人知道我们收到的推文数量与Twitter服务器收到的推文总数的比率是多少吗?我正在根据从示例API读取的数据进行一些分析,并希望估计Twitter服务器处理的实际工作负载。我观察到,我们从API获得的推文数量随着时间的推移而变化。所以,我认为这是一个百分比样本。任何线索都将受到高度赞赏


感谢(基本上是老式的流媒体API)发布时,它大概占所有推文的1-2%。基于我对当前流式API的使用,如果它现在超过1%,甚至可能更少,我会感到惊讶。根据这些文档的说法,“但是他们忽略了API输出的音量是否与实际推文的速率成比例。

示例流
/statuses/sample
确实返回了大约1%的推文。Twitter通过在每秒1000毫秒中只发送10毫秒窗口内创建的tweet来对tweet进行采样。如果您想了解更多详细信息,可以阅读我在2015年2月2日发布的博客帖子:

,Twitter打算将流式API采样率重置为1%(它无意中提高了):

公共流媒体API样本端点(也称为POST状态/过滤器和GET状态/样本)计划在任何时候都在大约1%的公共推文量上进行调整

由于过去的一些配置不一致,通过流式API发送的推文量可能已经超过了这些参数

此通知旨在表明,在未来几周内,我们将对公共流媒体API进行更改,以重新平衡推文量,使其达到预期的1%容量


显示了重置对典型tweet流的影响。

这是我在 . 我希望你觉得这有用

研究估计,使用Twitter的流媒体API用户可以 预计将收到1%到40%以上的推文 以近乎实时的方式


网页底部有他们引用的研究的参考资料。

就公共时间线而言,它提供了1500条最热门的推文。嗨@BhanuKaushik,我想,也许我们在谈论不同的API。因为,twitter示例API似乎没有限制要爬网的tweet数量。你可以让它存活一天,并将产生大约7~8GB的推特。嗨@muffinista,非常感谢你的回复。我也怀疑它是否真的高达1%,因为每秒只有30~80条推。如果我根据位置边界框获取推文,缩小位置是否会为该位置获得更多推文?