Mediawiki 如何通过API获取维基百科的文本内容？_Mediawiki_Wikipedia_Wikipedia Api

Mediawiki 如何通过API获取维基百科的文本内容？

mediawiki

Mediawiki 如何通过API获取维基百科的文本内容？,mediawiki,wikipedia,wikipedia-api,Mediawiki,Wikipedia,Wikipedia Api,我想把维基百科页面作为文本我在这里查看了Wikipedia API，它说为了将页面作为文本，我需要将其附加到页面地址： api.php?action=query&meta=siteinfo&siprop=namespaces&format=txt 但是，当我尝试将此后缀附加到普通页面的地址时，找不到该页面： https://en.wikipedia.org/wiki/George_Washington/api.php?action=query&meta=sit

我想把维基百科页面作为文本

我在这里查看了Wikipedia API，它说为了将页面作为文本，我需要将其附加到页面地址：

api.php?action=query&meta=siteinfo&siprop=namespaces&format=txt

但是，当我尝试将此后缀附加到普通页面的地址时，找不到该页面：

https://en.wikipedia.org/wiki/George_Washington/api.php?action=query&meta=siteinfo&siprop=namespaces&format=txt

按照中的说明，我尝试将/api.php？action=parse&page=test添加到查询字符串的末尾。因此，我得到了：

https://en.wikipedia.org/wiki/George_Washington/api.php?action=parse&page=test

但是，这也不起作用。

您必须使用其中一些：

json

，

jsonfm

，

none

，

php

，

phpfm

，

rawfm

，

xml

或

xmlfm

，因此

txt

格式无效。此外，您的API链接错误，请使用以下方法：

https://en.wikipedia.org/w/api.php?action=query&titles=George_Washington&prop=revisions&rvprop=content&format=xml

NB：所有这些示例都启用了CORS

从精确的标题中获取json格式的文本（如中所示）：

通过关键字搜索相关页面，获取ID，获取准确的标题/url，获取一些快速文本提取

通过精确的标题获取wiki页面ID：

通过wiki页面ID获取完整的html：

获取精简的html，没有wikidata的较轻版本

跨原点：
顺便说一句，使用CORS请求，通过知道或搜索ID和/或页面标题，我们可以使用fetch在ssl上下文中的任何位置嵌入一些wiki文本
在未知ID的情况下，我们必须循环槽

fetch（“https://en.wikipedia.org/w/api.php?action=query&origin=*&prop=extracts&explaintext&format=json&titles=Sokolsky_Opening”）。然后（v=>v.json（））。然后（（函数（v）{ main.innerHTML=v[“查询”][“页面”][“100017”][“提取”] }) )

很抱歉，可能是重复的，但您是否确实阅读了链接到的说明？能否添加每个参数的确切功能？api文档有点混乱，您必须修改url，例如这是
action=query
的文档是的，我知道这是一团乱，这就是为什么我在这里：）我一直在寻找您的第一个示例如何最终以明文形式结束，并删除了大部分标记。似乎是
prop=extracts&explaintext
extracts
提供了最小的HTML，而
explaintext
从中删除了HTML这是我仅有的注释，但它看起来像这样吗？否则，请看这里，所有参数都是详细的