Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/339.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 是否有api可以下载mediawiki服务器中存储的所有excel文件,以便使用pandas进行数据分析?_Python_Api_Mediawiki_Pywikibot - Fatal编程技术网

Python 是否有api可以下载mediawiki服务器中存储的所有excel文件,以便使用pandas进行数据分析?

Python 是否有api可以下载mediawiki服务器中存储的所有excel文件,以便使用pandas进行数据分析?,python,api,mediawiki,pywikibot,Python,Api,Mediawiki,Pywikibot,我有一个python脚本,可以在给定一组excel文件的情况下进行数据分析。现在,我们正试图通过定期搜索mediawiki服务器以获取任何最近上传的excel文件并应用我的脚本来自动化这一步骤 我们正在尝试看看是否有任何方法可以至少获取excel文件的URL 有人能帮我们吗?要从2021年4月4日午夜起以XML格式上传到英文维基百科,请发送https://en.wikipedia.org/w/api.php?action=query&list=logevents&leaction=upload/

我有一个python脚本,可以在给定一组excel文件的情况下进行数据分析。现在,我们正试图通过定期搜索mediawiki服务器以获取任何最近上传的excel文件并应用我的脚本来自动化这一步骤

我们正在尝试看看是否有任何方法可以至少获取excel文件的URL


有人能帮我们吗?

要从2021年4月4日午夜起以XML格式上传到英文维基百科,请发送
https://en.wikipedia.org/w/api.php?action=query&list=logevents&leaction=upload/upload&lestart=2021-04-04T00:00:00Z&lelimit=100&format=xml

要提取以
.xls
.xlsx
结尾的上载文件名,请使用XPath 1查询
(//item[以(@title,.xls')结尾]|//item[以(@title,.xlsx'))结尾)/@title

要从图像页面的名称中获取实际的图像URL,请使用
https://en.wikipedia.org/w/api.php?action=query&titles=File:Limbo Royal Blood.jpg |文件:Miriam Roth的照片。jpg&prop=imageinfo&iilimit=100&iiprop=url
并应用XPath
//imageinfo/ii/@url


看。

非常感谢!我临时根据您的回答,使用mediawiki api,并能够通过“https://******.org/api.php?action=query&list=allimages&aiprop=user | mime | timestamp | url&aisort=timestamp&aidir=older&ailimit=500&aimime=application/vnd.openxmlformats of icedocument.spreadsheetml.sheet&format=json”只过滤excel文件。我们计划读取json文件并将数据加载到pandas数据框中,使用URL下载excel文件并将其读取到另一个数据框中。目前唯一的问题是,当我尝试读取json时,我们被困在“readapidenied”上。如果可以的话,请帮忙!再次感谢!关闭Miser模式();您可能还需要发送身份验证()后获得的cookie();您可能希望确保未对所有用户或您的用户组()禁用API模块。