收集符合条件的随机twitter对话

收集符合条件的随机twitter对话,twitter,tweets,Twitter,Tweets,我需要收集tweet的“集合”,即我的研究中的twitter对话 这些集合还需要满足 其中的推文数量,以及 参与人数 我看过Twitter流API、Twitter流gem,但我发现它们都不适合我的目的 有什么简单的方法可以实现这个目标吗?你的出发点是什么?你如何判断tweet是否符合你的标准 一旦你做到了这一点,它就相当简单了 获取作为对话起点的tweet 搜索对该推文的回复。 Twitter不允许您搜索“in_reply_to”,但您可以搜索提到“@user”的所有人,并通过“in_r

我需要收集tweet的“集合”,即我的研究中的twitter对话

这些集合还需要满足

  • 其中的推文数量,以及
  • 参与人数
我看过Twitter流API、Twitter流gem,但我发现它们都不适合我的目的


有什么简单的方法可以实现这个目标吗?

你的出发点是什么?你如何判断tweet是否符合你的标准

一旦你做到了这一点,它就相当简单了

  • 获取作为对话起点的tweet
  • 搜索对该推文的回复。
    • Twitter不允许您搜索“in_reply_to”,但您可以搜索提到“@user”的所有人,并通过“in_reply_to”进行过滤
  • 递归地重复

您将得到一个以起始tweet作为根节点的树。您应该能够遍历该树以查看有多少唯一用户以及有多少tweet。

看起来您和我有相同的目的,我已经为它编写了一些python代码。

用法:

来自tccp导入搜索会话的

#获取10个英语对话
对于搜索会话中的会话({“l”:“en”},10):
对于对话中的tweet:
打印(推特[“作者”]+:“+推特[“内容”])

虽然这是一条老线索,但我希望这能帮助到某些人。

您是否正在挖掘相关评论?是否有推荐的工具?还是我应该自己处理twitter API?单凭推特流媒体API就足以做到这一点吗?常规API将允许您提取特定推特和回复。您计划使用哪种语言?最有可能是Python。它还能在没有特定查询的情况下提取随机推文及其回复吗?我还听说每次推特检索之间有28秒的强制暂停,这将极大地延长整个过程。这有解决办法吗,还是不可避免?非常感谢您的回复。是的,这里有一个“示例”API调用——在28秒的时间里,我从来没有听说过,文档中也没有提到它(尽管可能有其他速率限制)。Thanx,我会在16小时内给您奖金:)顺便问一下,推特检索通常是通过URL请求完成的,就像在您的链接中一样吗?如果我使用Python来使用twitter api,这会是个好主意吗?