Mediawiki 如何通过API获取维基百科的文本内容?

Mediawiki 如何通过API获取维基百科的文本内容?,mediawiki,wikipedia,wikipedia-api,Mediawiki,Wikipedia,Wikipedia Api,我想把维基百科页面作为文本 我在这里查看了Wikipedia API,它说为了将页面作为文本,我需要将其附加到页面地址: api.php?action=query&meta=siteinfo&siprop=namespaces&format=txt 但是,当我尝试将此后缀附加到普通页面的地址时,找不到该页面: https://en.wikipedia.org/wiki/George_Washington/api.php?action=query&meta=sit

我想把维基百科页面作为文本

我在这里查看了Wikipedia API,它说为了将页面作为文本,我需要将其附加到页面地址:

api.php?action=query&meta=siteinfo&siprop=namespaces&format=txt
但是,当我尝试将此后缀附加到普通页面的地址时,找不到该页面:

https://en.wikipedia.org/wiki/George_Washington/api.php?action=query&meta=siteinfo&siprop=namespaces&format=txt
按照中的说明,我尝试将/api.php?action=parse&page=test添加到查询字符串的末尾。因此,我得到了:

https://en.wikipedia.org/wiki/George_Washington/api.php?action=parse&page=test
但是,这也不起作用。

您必须使用其中一些:
json
jsonfm
none
php
phpfm
rawfm
xml
xmlfm
,因此
txt
格式无效。此外,您的API链接错误,请使用以下方法:

https://en.wikipedia.org/w/api.php?action=query&titles=George_Washington&prop=revisions&rvprop=content&format=xml

NB:所有这些示例都启用了CORS


从精确的标题中获取json格式的文本(如中所示):


通过关键字搜索相关页面,获取ID,获取准确的标题/url,获取一些快速文本提取


通过精确的标题获取wiki页面ID


通过wiki页面ID获取完整的html


获取精简的html,没有wikidata的较轻版本


跨原点:

顺便说一句,使用CORS请求,通过知道或搜索ID和/或页面标题,我们可以使用fetch在ssl上下文中的任何位置嵌入一些wiki文本

在未知ID的情况下,我们必须循环槽

fetch(“https://en.wikipedia.org/w/api.php?action=query&origin=*&prop=extracts&explaintext&format=json&titles=Sokolsky_Opening”)。然后(v=>v.json())。然后((函数(v){
main.innerHTML=v[“查询”][“页面”][“100017”][“提取”]
})
)

很抱歉,可能是重复的,但您是否确实阅读了链接到的说明?能否添加每个参数的确切功能?api文档有点混乱,您必须修改url,例如这是
action=query
的文档是的,我知道这是一团乱,这就是为什么我在这里:)我一直在寻找您的第一个示例如何最终以明文形式结束,并删除了大部分标记。似乎是
prop=extracts&explaintext
extracts
提供了最小的HTML,而
explaintext
从中删除了HTML这是我仅有的注释,但它看起来像这样吗?否则,请看这里,所有参数都是详细的