如何使用wget和grep下载pdf

如何使用wget和grep下载pdf,pdf,grep,wget,Pdf,Grep,Wget,我需要下载pdf从html与wget和grep wget(链接) grep-Eo'HREF=“[^”]+\.pdf”(来自wget的文件) 结果: HREF="./slides/PA - intro python - bases algorithmiques.pdf" HREF="./slides/PB - programmation modulaire avec python.pdf" HREF="./slides/PC - collectio

我需要下载pdf从html与wget和grep

wget(链接)

grep-Eo'HREF=“[^”]+\.pdf”(来自wget的文件)

结果:

HREF="./slides/PA - intro python - bases algorithmiques.pdf"
HREF="./slides/PB - programmation modulaire avec python.pdf"
HREF="./slides/PC - collections sous python.pdf"
HREF="./slides/PD - classes sous python.pdf"
HREF="./slides/PE - fichiers sous python.pdf"
HREF="./slides/PG - vecteurs avec numpy.pdf"
HREF="./slides/PH - matrices avec numpy.pdf"
我只需要使用wget和grep下载pdf,我不能使用:


wget-A pdf-r-l 1(链接)

您可以使用
cut-f2'-d'
从HREF列表中获取第二个
分隔字段:

/v/f/n/8/T/tmp.lwgNOsXH $ cat > hrefs.txt

HREF="./slides/PA - intro python - bases algorithmiques.pdf"
HREF="./slides/PB - programmation modulaire avec python.pdf"
HREF="./slides/PC - collections sous python.pdf"
HREF="./slides/PD - classes sous python.pdf"
HREF="./slides/PE - fichiers sous python.pdf"
HREF="./slides/PG - vecteurs avec numpy.pdf"
HREF="./slides/PH - matrices avec numpy.pdf"

/v/f/n/8/T/tmp.lwgNOsXH $ cut -f2 '-d"' hrefs.txt

./slides/PA - intro python - bases algorithmiques.pdf
./slides/PB - programmation modulaire avec python.pdf
./slides/PC - collections sous python.pdf
./slides/PD - classes sous python.pdf
./slides/PE - fichiers sous python.pdf
./slides/PG - vecteurs avec numpy.pdf
./slides/PH - matrices avec numpy.pdf

/v/f/n/8/T/tmp.lwgNOsXH $