Node.js 维基百科API信息盒

Node.js 维基百科API信息盒,node.js,wikipedia-api,Node.js,Wikipedia Api,我正在使用WikipediaAPI从某些页面获取信息框。 例如 我的问题是我得到的HESA学生群体| instd=0132值。我希望只得到学生人数,但我得到的是上面的id。如何获取页面中信息框的值 此外,如果您选中,则有两个信息框(主信息框和排名信息框)。如何获取这两种内容?您可以使用另一种方法访问维基百科内容。要获得您要求的文章的结构良好的HTML,请执行以下操作: https://en.wikipedia.org/api/rest_v1/page/html/Imperial_College_

我正在使用WikipediaAPI从某些页面获取信息框。 例如 我的问题是我得到的
HESA学生群体| instd=0132
值。我希望只得到学生人数,但我得到的是上面的id。如何获取页面中信息框的值

此外,如果您选中,则有两个信息框(主信息框和排名信息框)。如何获取这两种内容?

您可以使用另一种方法访问维基百科内容。要获得您要求的文章的结构良好的HTML,请执行以下操作:

https://en.wikipedia.org/api/rest_v1/page/html/Imperial_College_London

HTML是由服务生成的,该服务按照以下步骤生成HTML/RDFa内容。收件箱将是html
table
元素,类为`infobox,因此您可以轻松找到页面上的所有收件箱


收件箱通常是由复杂的模板创建的,因此只解析HTML表可能更容易

你好@Petr。谢谢你的回复。我还不能使用这个api(尽管它更干净),因为它仍然处于测试阶段。不过,我可以用它做同样的事情。它使用当前/稳定的api,所有样式都存在,因此我可以使用相同的逻辑(解析)。我已经考虑过这个问题,但我希望有一个更好/更干净/更快的方法来做到这一点。@alkis我是这个API的开发人员,所以我可以向您保证,“beta”状态对您来说不会是一个问题。
/page/html
端点现在非常稳定,被维基媒体内外的几个主要客户端使用。VisualEditor、Android应用程序、内容翻译工具和其他功能都依赖于此API。这是个好消息。它也快吗?它似乎比PHP API快很多,因为这些API是由Varnish缓存的,所以在获取缓存内容方面有很大的变化。而PHP API根本就没有缓存。看,是的,我已经读过了。维基文本是可编辑的。我用过一些npm库,但没有什么强大的。一些值不存在(例如,我在问题中提到的值)。返回带有类的html的api非常好。仍然存在一些问题,但通过在解析中进行一些调整,我可以克服这些问题。有了这个问题,我想知道我是否缺少一些功能。没有任何东西会返回纯infobox,但是新的api速度很快,包含了我需要的所有信息。如果你读过,那么你肯定已经看过了?是的。不幸的是,并非所有的值都存在。