Mediawiki 大量获取维基百科摘录

Mediawiki 大量获取维基百科摘录,mediawiki,wikipedia,wikipedia-api,Mediawiki,Wikipedia,Wikipedia Api,有没有办法从维基百科获取所有标题/摘录对?到目前为止,我发现了两种方法: 下载摘录转储,但它包含作为文章第一行的不完整/无效摘录 使用MediaWiki API请求摘录,但速度非常慢,因为每个请求只能获取一个摘录(批量查询不适用于摘录): /w/api.php?action=query&format=json&titles=Main 页面&重定向&prop=extracts&explaintext=&exintro= 我想获得摘录,因为它们是由MediaWiki API生成的,而不需要负担维

有没有办法从维基百科获取所有标题/摘录对?到目前为止,我发现了两种方法:

  • 下载摘录转储,但它包含作为文章第一行的不完整/无效摘录
  • 使用MediaWiki API请求摘录,但速度非常慢,因为每个请求只能获取一个摘录(批量查询不适用于摘录):
/w/api.php?action=query&format=json&titles=Main 页面&重定向&prop=extracts&explaintext=&exintro=

我想获得摘录,因为它们是由MediaWiki API生成的,而不需要负担维基百科服务器可能吗?

顺便说一句,我需要摘录为纯文本。不需要wiki文本或格式

更新。通过MediaWiki API一次最多可以获得20篇摘录:

&exlimit=20


目前还不可能。Cou可以看看Yahoo的摘要,这些摘要试图做一些类似的事情(尽管不是很好)。它们的动力来自。

下载最后一个。