Web scraping 如何从英文维基百科上的所有文章中获取页面浏览量统计数据?

Web scraping 如何从英文维基百科上的所有文章中获取页面浏览量统计数据?,web-scraping,wikipedia,pageviews,Web Scraping,Wikipedia,Pageviews,以下是一个指向已制作的页面视图工具的链接: 但是你不能同时看到维基百科所有文章的浏览量。哪篇文章的观点最多,哪篇文章的观点最少 希望你能帮助我 有一个,在午夜(UTC)几小时后更新 例如: 它包括受欢迎的Wikipedia页面,这些页面本身不是“文章”,比如主页、搜索页面和其他一些页面。您可以通过检查英文维基百科上以Special:、Template:、User:、Talk:,等开头的标题来过滤掉这些内容 由于爬行器或机器人,您可能会注意到一些页面具有大量的页面浏览量。希望是这样 当前没有用

以下是一个指向已制作的页面视图工具的链接:

但是你不能同时看到维基百科所有文章的浏览量。哪篇文章的观点最多,哪篇文章的观点最少

希望你能帮助我

有一个,在午夜(UTC)几小时后更新

例如:

  • 它包括受欢迎的Wikipedia页面,这些页面本身不是“文章”,比如主页、搜索页面和其他一些页面。您可以通过检查英文维基百科上以Special:、Template:、User:、Talk:,等开头的标题来过滤掉这些内容
  • 由于爬行器或机器人,您可能会注意到一些页面具有大量的页面浏览量。希望是这样

当前没有用于浏览次数最少的页面的API。您还可以获取所有维基百科或。

感谢@slaporte提供的链接和提示!非常有用。
{
  "items": [
  {
    "project": "en.wikipedia",
    "access": "all-access",
    "year": "2016",
    "month": "02",
    "day": "29",
    "articles": [
      {
        "article": "Main_Page",
        "views": 21384819,
        "rank": 1
      },
      {
        "article": "Special:Search",
        "views": 2211296,
        "rank": 2
      },
      {
        "article": "Steve_Blake",
        "views": 2084367,
        "rank": 3
      },
      ...