Java 维基百科解析器

Java 维基百科解析器,java,xml-parsing,wikipedia,Java,Xml Parsing,Wikipedia,我想通过解析器阅读wikipedia页面,例如JWPL。 我能做到,但我的问题是: 我想计算标题和章节之间的字符数,以及链接的数量 使用JWPL,我可以从列表中获得每个链接内的节的列表,但我无法计算字符数 总的来说,我的目标是阅读维基百科页面,将其数据模型转换为我的数据模型,并给出另一个包含我的数据模型的文件 我的数据模型是一个包含以下内容的文件:节名、数字“节与下一个链接或其他节之间的字符数 谢谢您的帮助。有一个更好的方法,就是使用wikipedia中当前可用的服务。您可以使用一组GET请求与

我想通过解析器阅读wikipedia页面,例如JWPL。 我能做到,但我的问题是:

我想计算标题和章节之间的字符数,以及链接的数量

使用JWPL,我可以从列表中获得每个链接内的节的列表,但我无法计算字符数

总的来说,我的目标是阅读维基百科页面,将其数据模型转换为我的数据模型,并给出另一个包含我的数据模型的文件

我的数据模型是一个包含以下内容的文件:节名、数字“节与下一个链接或其他节之间的字符数


谢谢您的帮助。

有一个更好的方法,就是使用wikipedia中当前可用的服务。您可以使用一组GET请求与之交互 阅读维基百科的元数据页面

mediawiki也解释了一些关于这种互动的内容


祝你好运

首先,感谢你的回复,我用同样的方法提取了页面,并在JWPL解析器中解析了它,但我无法计算节和链接之间的字符数,也无法处理解析器。你能进一步解释一下吗。你的输入是什么?为什么你不能解析它?