Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 获取维基百科编辑的API_Python_Parsing_Wikipedia_Wikipedia Api - Fatal编程技术网

Python 获取维基百科编辑的API

Python 获取维基百科编辑的API,python,parsing,wikipedia,wikipedia-api,Python,Parsing,Wikipedia,Wikipedia Api,我想得到编辑前后维基百科页面上的编辑文本。我有这个网址: https://en.wikipedia.org/w/index.php?diff=328391582&oldid=328391343 但是,我想要json格式的文本,这样我就可以在我的程序中直接使用它。是否有MediaWiki提供的API在编辑后为我提供新旧文本,或者我必须使用解析器解析HTML页面?尝试以下方法: 有几个选项可能有用,例如: rvparse:解析修订内容。出于性能原因,如果使用此选项,rvlimit将强制为1

我想得到编辑前后维基百科页面上的编辑文本。我有这个网址:

https://en.wikipedia.org/w/index.php?diff=328391582&oldid=328391343
但是,我想要json格式的文本,这样我就可以在我的程序中直接使用它。是否有MediaWiki提供的API在编辑后为我提供新旧文本,或者我必须使用解析器解析HTML页面?

尝试以下方法:

有几个选项可能有用,例如:

  • rvparse:解析修订内容。出于性能原因,如果使用此选项,rvlimit将强制为1

  • rvdifftotext:要将每个修订区分到的文本

  • 如果这些都失败了,还有很多问题

  • rvprop/ids:从1.16开始获取修订ID和父ID

  • 然后,一旦获得父ID,就可以比较这两个ID的文本

    在JavaScript中留下一条注释,说明如何查询Wikipedia API以获取所有最近的编辑

    在某些情况下,文章被锁定,无法查看最近的编辑


    嗯,有一个JSON格式的输出选项。。。我试过了,但没用。你怎么试的?使用比较API?这对我不管用。我需要两个单独的字符串,分别给出旧文本和新文本(无html标记)。compare操作提供一个带有html标记的文本。