Python 是否有api可以下载mediawiki服务器中存储的所有excel文件，以便使用pandas进行数据分析？_Python_Api_Mediawiki_Pywikibot

Python 是否有api可以下载mediawiki服务器中存储的所有excel文件，以便使用pandas进行数据分析？

python api mediawiki

Python 是否有api可以下载mediawiki服务器中存储的所有excel文件，以便使用pandas进行数据分析？,python,api,mediawiki,pywikibot,Python,Api,Mediawiki,Pywikibot,我有一个python脚本，可以在给定一组excel文件的情况下进行数据分析。现在，我们正试图通过定期搜索mediawiki服务器以获取任何最近上传的excel文件并应用我的脚本来自动化这一步骤我们正在尝试看看是否有任何方法可以至少获取excel文件的URL 有人能帮我们吗？要从2021年4月4日午夜起以XML格式上传到英文维基百科，请发送https://en.wikipedia.org/w/api.php?action=query&list=logevents&leaction=upload/

我有一个python脚本，可以在给定一组excel文件的情况下进行数据分析。现在，我们正试图通过定期搜索mediawiki服务器以获取任何最近上传的excel文件并应用我的脚本来自动化这一步骤

我们正在尝试看看是否有任何方法可以至少获取excel文件的URL

有人能帮我们吗？

要从2021年4月4日午夜起以XML格式上传到英文维基百科，请发送

https://en.wikipedia.org/w/api.php?action=query&list=logevents&leaction=upload/upload&lestart=2021-04-04T00:00:00Z&lelimit=100&format=xml

要提取以

.xls

或

.xlsx

结尾的上载文件名，请使用XPath 1查询

（//item[以（@title，.xls'）结尾]|//item[以（@title，.xlsx'））结尾）/@title

要从图像页面的名称中获取实际的图像URL，请使用

https://en.wikipedia.org/w/api.php?action=query&titles=File:Limbo Royal Blood.jpg |文件：Miriam Roth的照片。jpg&prop=imageinfo&iilimit=100&iiprop=url

并应用XPath

//imageinfo/ii/@url

看。

非常感谢！我临时根据您的回答，使用mediawiki api，并能够通过“https://******.org/api.php？action=query&list=allimages&aiprop=user | mime | timestamp | url&aisort=timestamp&aidir=older&ailimit=500&aimime=application/vnd.openxmlformats of icedocument.spreadsheetml.sheet&format=json”只过滤excel文件。我们计划读取json文件并将数据加载到pandas数据框中，使用URL下载excel文件并将其读取到另一个数据框中。目前唯一的问题是，当我尝试读取json时，我们被困在“readapidenied”上。如果可以的话，请帮忙！再次感谢！关闭Miser模式（）；您可能还需要发送身份验证（）后获得的cookie（）；您可能希望确保未对所有用户或您的用户组（）禁用API模块。