Parsing 从HTML文件获取jpg图像

Parsing 从HTML文件获取jpg图像,parsing,grep,html-parsing,Parsing,Grep,Html Parsing,我正在尝试使用grep在HTML文件中获取jpg图像的完整url地址。一个问题是它没有太多的换行符,所以当我使用grep时,它得到了路径,但还有很多其他我不感兴趣的东西。我如何才能获取jpg图像的URL?一个sed命令 sed -n '/<img/s/.*src="\([^"]*\)".*/\1/p' yourfile.html grep -o '<img[^>]*src="[^"]*"' yourfile.html 两个连续的基本grep命令 grep -o '<i

我正在尝试使用grep在HTML文件中获取jpg图像的完整url地址。一个问题是它没有太多的换行符,所以当我使用grep时,它得到了路径,但还有很多其他我不感兴趣的东西。我如何才能获取jpg图像的URL?

一个
sed
命令

sed -n '/<img/s/.*src="\([^"]*\)".*/\1/p' yourfile.html
grep -o '<img[^>]*src="[^"]*"' yourfile.html
两个连续的基本
grep
命令

grep -o '<img[^>]*src="[^"]*"' yourfile.html | grep -o '"[^"]*"'
使用
ack
作为
grep
类替代品

sudo apt install ack
ack -o '<img[^>]*src="\K[^"]*(?=")' yourfile.html
sudo apt安装确认
ack-o'
根据建议下载网页


curl-s example.com/a.html | sed-En'/您能提供一个html示例和当前的
grep
命令吗?哇,太棒了!你花了多长时间才想到这些?你是凭记忆做的,还是要查东西?第一个命令就是我需要的。其他人稍微有点不对劲。不过,我还是印象深刻。你花了多长时间才精通sed?我们能成为facebook上的朋友吗?谢谢,这正是我所需要的!(使用
grep
)。为了完成您的回答,我使用以下组合下载了本地自动创建的path所需的所有图像(在我的例子中是针对csv文件中的html):
cat myfile.csv | grep-o'src=”“[^”]*“| cut-b5-| xargs wget-p
从url获取图像:curl www.a-web-page-url.com/| sed-n'/Hi@VictorioBerra。如果使用s-hunter的注释建议的命令行,则添加选项
-r
。这是正确的命令行:
curl www.a-web-page-url.com/| sed-n-r'/。我正在编辑/改进我的答案以使其清晰。祝你新年快乐;-)
grep -Po '<img[^>]*src="\K[^"]*(?=")' yourfile.html
sudo apt install ack
ack -o '<img[^>]*src="\K[^"]*(?=")' yourfile.html
curl -s example.com/a.html | sed -En '/<img/s/.*src="([^"]*)".*/\1/p'