如何在Windows上通过“特殊:使用curl/wget导出”导出名为斜杠的Wikipedia文章
我试图通过“特殊:导出”下载文件列表。 只要名称中没有斜杠或异国情调的字符,这种方法就行如何在Windows上通过“特殊:使用curl/wget导出”导出名为斜杠的Wikipedia文章,windows,curl,mediawiki,wget,wikipedia,Windows,Curl,Mediawiki,Wget,Wikipedia,我试图通过“特殊:导出”下载文件列表。 只要名称中没有斜杠或异国情调的字符,这种方法就行 Österreichischer_Fußball-Cup_2013/14 --> Slash after 2013 tried to replace slash with %2F did not work İlhan_ Cihaner --> not in Latin @echo off setlocal enabledelayedexpansion for /
Österreichischer_Fußball-Cup_2013/14 --> Slash after 2013 tried to replace slash with %2F did not work
İlhan_ Cihaner --> not in Latin
@echo off
setlocal enabledelayedexpansion
for /f %%l in (wikipedia.test) do (
curl -O http://de.wikipedia.org/wiki/Spezial:Exportieren/"%%l"
)
我已经尝试通过URL编码(仅文章名),但这不起作用。
也试过
@echo off
setlocal enabledelayedexpansion
for /f %%l in (wikipedia.test) do (
curl --data-urlencode "&pages=%%l&offset=1&action=submit" http://de.wikipedia.org/w/index.php?title=Special:Export -o %%l.xml
)
在curl手册中,我没有找到任何提示…您可以使用'pages'参数进行特殊:导出,如下所示:
挑剔,但İ完全是拉丁语,尽管不在ISO基本子集中。现在,当页面名称中有
İ
或/
时会发生什么?有要共享的错误消息吗?没有错误消息。结果(XML)中缺少该页。