如何获取所有维基百科的页面ID和标题';通过MediaWiki API创建内容页?

如何获取所有维基百科的页面ID和标题';通过MediaWiki API创建内容页?,mediawiki,wikipedia,wikipedia-api,wikidata,mediawiki-api,Mediawiki,Wikipedia,Wikipedia Api,Wikidata,Mediawiki Api,上面的链接显示,英文维基百科有近600万个内容页面。如何使用MediaWiki API获取所有内容页的页面ID和标题 params = { 'action': 'query', 'list': 'allpages', 'gapfilterredir': 'nonredirects', 'apnamespace': 0, 'aplimit': 500, 'format': 'json' } 我尝试过这种API格式,虽然我将“gapfilterred

上面的链接显示,英文维基百科有近600万个内容页面。如何使用MediaWiki API获取所有内容页的页面ID和标题

params = {
    'action': 'query',
    'list': 'allpages',
    'gapfilterredir': 'nonredirects',
    'apnamespace': 0,
    'aplimit': 500,
    'format': 'json'
}
我尝试过这种API格式,虽然我将“gapfilterredir”设置为“nonredirects”,但仍有一些重定向页面,被刮除的项目远远超过600万个。

最好是通过,但如果您真的想使用该API,您所展示的方法是正确的。统计数据不包括某些非常短的页面(如果我没记错的话,没有内部链接或句点的页面),这就是数字不同的原因