Python 是否有api可以下载mediawiki服务器中存储的所有excel文件,以便使用pandas进行数据分析?
我有一个python脚本,可以在给定一组excel文件的情况下进行数据分析。现在,我们正试图通过定期搜索mediawiki服务器以获取任何最近上传的excel文件并应用我的脚本来自动化这一步骤 我们正在尝试看看是否有任何方法可以至少获取excel文件的URLPython 是否有api可以下载mediawiki服务器中存储的所有excel文件,以便使用pandas进行数据分析?,python,api,mediawiki,pywikibot,Python,Api,Mediawiki,Pywikibot,我有一个python脚本,可以在给定一组excel文件的情况下进行数据分析。现在,我们正试图通过定期搜索mediawiki服务器以获取任何最近上传的excel文件并应用我的脚本来自动化这一步骤 我们正在尝试看看是否有任何方法可以至少获取excel文件的URL 有人能帮我们吗?要从2021年4月4日午夜起以XML格式上传到英文维基百科,请发送https://en.wikipedia.org/w/api.php?action=query&list=logevents&leaction=upload/
有人能帮我们吗?要从2021年4月4日午夜起以XML格式上传到英文维基百科,请发送
https://en.wikipedia.org/w/api.php?action=query&list=logevents&leaction=upload/upload&lestart=2021-04-04T00:00:00Z&lelimit=100&format=xml
要提取以.xls
或.xlsx
结尾的上载文件名,请使用XPath 1查询(//item[以(@title,.xls')结尾]|//item[以(@title,.xlsx'))结尾)/@title
要从图像页面的名称中获取实际的图像URL,请使用https://en.wikipedia.org/w/api.php?action=query&titles=File:Limbo Royal Blood.jpg |文件:Miriam Roth的照片。jpg&prop=imageinfo&iilimit=100&iiprop=url
并应用XPath//imageinfo/ii/@url
看。非常感谢!我临时根据您的回答,使用mediawiki api,并能够通过“https://******.org/api.php?action=query&list=allimages&aiprop=user | mime | timestamp | url&aisort=timestamp&aidir=older&ailimit=500&aimime=application/vnd.openxmlformats of icedocument.spreadsheetml.sheet&format=json”只过滤excel文件。我们计划读取json文件并将数据加载到pandas数据框中,使用URL下载excel文件并将其读取到另一个数据框中。目前唯一的问题是,当我尝试读取json时,我们被困在“readapidenied”上。如果可以的话,请帮忙!再次感谢!关闭Miser模式();您可能还需要发送身份验证()后获得的cookie();您可能希望确保未对所有用户或您的用户组()禁用API模块。