Json 获取维基媒体共享图片的深度链接_Json_Bash_Parsing_Mediawiki Api_Wikimedia Commons

Json 获取维基媒体共享图片的深度链接

json bash parsing

Json 获取维基媒体共享图片的深度链接,json,bash,parsing,mediawiki-api,wikimedia-commons,Json,Bash,Parsing,Mediawiki Api,Wikimedia Commons,我想从Wikimedia Commons图片中获取全文URL。作为我想从中得到的例子。以下是html源代码： <div class="fullMedia"><a href="https://upload.wikimedia.org/wikipedia/commons/6/69/Trittin%2C_J%C3%BCrgen-0126.jpg" class="internal" title="Trittin, Jürgen-0126.jpg">Original file<

我想从Wikimedia Commons图片中获取全文URL。作为我想从中得到的例子。以下是html源代码：

<div class="fullMedia"><a href="https://upload.wikimedia.org/wikipedia/commons/6/69/Trittin%2C_J%C3%BCrgen-0126.jpg" class="internal" title="Trittin, Jürgen-0126.jpg">Original file</a> &#8206;<span class="fileInfo">(1,996 × 3,000 pixels, file size: 2.2 MB, MIME type: <span class="mime-type">image/jpeg</span>)</span>
</div>

‎；（1996×3000像素，文件大小：2.2MB，MIME类型：图像/jpeg）

因为我要做很多查询，所以我更喜欢一个轻量级的unix工具解决方案，而不是像BeautifulSoup这样的东西。还有一个API（），但对于我这个简单的bash脚本编写者来说，JSON是一种强加

如果您能帮助我，我很高兴。

在URL中替换

File:

与

我使用curl和grep的技巧：

 curl -s https://commons.wikimedia.org/wiki/File:Trittin,_J%C3%BCrgen-0126.jpg | grep fullImageLink | grep -o  'http[^ ]*jpg'

正如其他人所说，您应该使用

减轻痛苦

 curl -s https://commons.wikimedia.org/wiki/File:Trittin,_J%C3%BCrgen-0126.jpg | grep fullImageLink | grep -o  'http[^ ]*jpg'

curl --silent 'https://commons.wikimedia.org/w/api.php?format=json&formatversion=2&action=query&prop=imageinfo&titles=File:Trittin,_J%C3%BCrgen-0126.jpg&iiprop=url' | jq --raw-output '.query.pages[0].imageinfo[0].url'