Php 是否有一个API来确定许多tweet中最常见的链接?

Php 是否有一个API来确定许多tweet中最常见的链接?,php,twitter,bit.ly,Php,Twitter,Bit.ly,是否有一个API(Twitter API不提供此功能),我可以使用它来确定200条推文中最常见的链接,例如。我想做的是获取最新的200条tweet,然后确定人们在谈论什么,我确信这些tweet将包含链接(因为我将要求twitterapi返回仅包含链接的tweet)但我还想确保我的代码能够理解两个URL是相同的,即使它们有不同的bit.ly链接 我想做的是(这可能会让你们更容易提供一些帮助)确定人们在这200条推文中谈论的最重要的主题是什么。我知道人们可能在谈论同一个故事,但提供了不同的链接,然而

是否有一个API(Twitter API不提供此功能),我可以使用它来确定200条推文中最常见的链接,例如。我想做的是获取最新的200条tweet,然后确定人们在谈论什么,我确信这些tweet将包含链接(因为我将要求twitterapi返回仅包含链接的tweet)但我还想确保我的代码能够理解两个URL是相同的,即使它们有不同的bit.ly链接

我想做的是(这可能会让你们更容易提供一些帮助)确定人们在这200条推文中谈论的最重要的主题是什么。我知道人们可能在谈论同一个故事,但提供了不同的链接,然而,我不确定是否有一种简单的方式来理解这一点

链接到示例、API、示例代码和任何其他想法都会很有帮助:)


如果您需要更多信息来解释这一点,请告诉我,我将对问题进行编辑,以包含更多信息

我不知道,但您可以通过..来完成这一点

  • 使用正则表达式模式查找tweet列表中的所有链接

  • 使用twitter搜索api搜索每个链接。返回的结果数

  • 根据返回的结果对链接进行手动排序


  • 从根本上说,你可以从api中获取这些信息,首先获取最新的公共时间线(这将是100条推文,如果你需要200条推文,那么你需要请求一个游标并创建一个循环来检查下一个游标值是否大于0),然后构建一个确定相关性的爬行器

    哪里???是json、xml、rss还是atom

    如果要确定单词的流行程度,请将所有文本转储到一个字符串中,然后在空格、标点符号等上拆分,丢弃非名词,对其进行排序,并创建一个包含单词和单词计数的字典变量


    如果你想确定链接的受欢迎程度,那么这是一个相同的过程,但还有一个额外的步骤,即对每个链接执行web请求,以确定最终的链接目的地。

    根据其他人的说法,你可以使用推特搜索来获取推文,没有问题,我不会在回答中讨论这一部分

    短链接的可能路线:

    例如,您可以转到bit.ly并为要跟踪的url创建自定义短链接。使用该链接,如果您在url的末尾添加一个+,您将获得链接统计信息。示例:此外,bit.ly跟踪指向同一url的其他短链接。然后您可以在搜索中使用它

    使用可以获得缩短URL的列表

    根据您试图跟踪的URL,您可以访问推荐日志。(即您自己的网站)使用您的推荐日志,您还可以找到其他简短的URL,您可以使用这些URL进行搜索