如何使用wget和grep下载pdf
我需要下载pdf从html与wget和grep如何使用wget和grep下载pdf,pdf,grep,wget,Pdf,Grep,Wget,我需要下载pdf从html与wget和grep wget(链接) grep-Eo'HREF=“[^”]+\.pdf”(来自wget的文件) 结果: HREF="./slides/PA - intro python - bases algorithmiques.pdf" HREF="./slides/PB - programmation modulaire avec python.pdf" HREF="./slides/PC - collectio
wget(链接)
grep-Eo'HREF=“[^”]+\.pdf”(来自wget的文件)
结果:
HREF="./slides/PA - intro python - bases algorithmiques.pdf"
HREF="./slides/PB - programmation modulaire avec python.pdf"
HREF="./slides/PC - collections sous python.pdf"
HREF="./slides/PD - classes sous python.pdf"
HREF="./slides/PE - fichiers sous python.pdf"
HREF="./slides/PG - vecteurs avec numpy.pdf"
HREF="./slides/PH - matrices avec numpy.pdf"
我只需要使用wget和grep下载pdf,我不能使用:
wget-A pdf-r-l 1(链接)
您可以使用cut-f2'-d'
从HREF列表中获取第二个“
分隔字段:
/v/f/n/8/T/tmp.lwgNOsXH $ cat > hrefs.txt
HREF="./slides/PA - intro python - bases algorithmiques.pdf"
HREF="./slides/PB - programmation modulaire avec python.pdf"
HREF="./slides/PC - collections sous python.pdf"
HREF="./slides/PD - classes sous python.pdf"
HREF="./slides/PE - fichiers sous python.pdf"
HREF="./slides/PG - vecteurs avec numpy.pdf"
HREF="./slides/PH - matrices avec numpy.pdf"
/v/f/n/8/T/tmp.lwgNOsXH $ cut -f2 '-d"' hrefs.txt
./slides/PA - intro python - bases algorithmiques.pdf
./slides/PB - programmation modulaire avec python.pdf
./slides/PC - collections sous python.pdf
./slides/PD - classes sous python.pdf
./slides/PE - fichiers sous python.pdf
./slides/PG - vecteurs avec numpy.pdf
./slides/PH - matrices avec numpy.pdf
/v/f/n/8/T/tmp.lwgNOsXH $