解析/迭代html源代码以仅使用wget访问特定文件_Html_Bash_Recursion_Scripting_Wget - Fatal编程技术网

解析/迭代html源代码以仅使用wget访问特定文件

html bash recursion scripting

解析/迭代html源代码以仅使用wget访问特定文件,html,bash,recursion,scripting,wget,Html,Bash,Recursion,Scripting,Wget,好吧，这可能已经被问到了，但经过几个小时的搜索，我没有找到任何可行的，所以比方说，有一个名为index.html的页面，其中包含指向不同页面的多个超链接。这些页面包含要下载的文件 e、 g ... ... 第1页可能是这样的  ... <a href="page1file.pdf">Download</a> ... ... ... 现在我想下载所有的*.pdf文件。是否有可能仅使用wget执行此操作，或者我需

好吧，这可能已经被问到了，但经过几个小时的搜索，我没有找到任何可行的，所以

比方说，有一个名为

index.html

的页面，其中包含指向不同页面的多个超链接。这些页面包含要下载的文件

e、 g


...
...

第1页可能是这样的

<!-- page1.html -->
...
<a href="page1file.pdf">Download</a>
...


...
...

现在我想下载所有的

*.pdf

文件。是否有可能仅使用wget执行此操作，或者我需要为此创建一个脚本

提前感谢您。

不确定是否只能使用wget，但此循环应该可以：

for i in $(grep "^<a" index.html | cut -d'"' -f2); do file=$(grep "^<a" $i | cut -d'"' -f2); wget $i/$file ; done

对于i，单位为$（grep）^不确定是否只能使用wget，但此循环应该可以：
for i in $(grep "^<a" index.html | cut -d'"' -f2); do file=$(grep "^<a" $i | cut -d'"' -f2); wget $i/$file ; done

以美元表示的i的（grep）^我们是否可以说每个文件都可以使用以下URL语法下载：pageX.html/pageXfile.pdf
？遗憾的是，不是。文件名在任何情况下都是唯一的。我们是否可以说每个文件都可以使用以下URL语法下载：pageX.html/pageXfile.pdf
？遗憾的是，不是。文件名在任何情况下都是唯一的。




[bash]相关文章推荐



                                                        
Bash 如何模拟cron执行脚本的环境？
bashscriptingcron 
使用bash筛选文件名
bashshell 
自定义Bash提示符以包括挂起进程的数量
bash 
rpm规范文件中这行bash脚本中的| |：是做什么的？
bash 
Bash 我的选项解析代码段
bash 
是否使用bash命令将头作为stdout的前缀？
bashshellunix 
Bash 在下载完成之前完成带有SFTP和mget的Shell脚本
bashshellftp 
Bash nohup和简单输出重定向之间的区别
bashredirect 
Bash 如何将CMake输出保存到文件？
bashcmake 
Bash显示网页中的日期和时间值

课程时间表最后更新日期为2015年5月4日上午11:18
bash 
Bash重命名字符串中的最后一个下划线
bash 
Bash管道文件重定向打印࿽；
bash 
反报价中的bash反报价
bashshell 
Bash 使用管道和重定向解析输入字符串
bashunix 
退出由同一bash脚本调用的程序时触发的脚本命令
bashscripting 
bash ffmpeg使用输入文件名作为输出视频文件名
bashfor-loopvideoffmpeg 
获取多个变量中存在的变量的Bash快捷方式
bashif-statementlogic 
如何使用bash变量作为awk输入文件
在BASH脚本中间有一行AWK会引发错误，我不知道如何修复。
bashawk 
Bash 如何通过find命令逐个重命名所有文件？
bashshellfile 
Bash MACOS-用于扩展名已删除的文件和进程文件上的循环
bashmacosloops 
                                       





随机文章推荐



                                                        
Laravel 5 具有特殊字符的dompdf
laravel-5 
Laravel 5 Laravel 5身份验证：用户必须实现CanResetPassword接口
laravel-5 
Laravel 5 拉维长生不老药-定制路径上的SASS手表？
laravel-5 
Laravel 5 在URL中随处配置SSL
laravel-5 
Laravel 5 使用2个可能的身份验证程序Laravel在用户名为@gmail.com的smtp服务器上进行身份验证失败的解决方案无效
laravel-5 
Laravel 5 Can'；t向自定义命令添加参数
laravel-5 
Laravel 5 设置laravel 5表单中输入标签的值
laravel-5 
Laravel 5 Laravel存储库模式和多对多关系
laravel-5 
Laravel 5 如何使用快速加载Laravel5.2获取多表记录
laravel-5 
Laravel 5 Laravel语言环境中间件不适用于所有路线&；区域设置会话在注销后销毁
laravel-5 
Laravel 5 如何在laravel中访问我的模型？
laravel-5 
Laravel 5 使用laravel eloquent从相关表中删除所有记录
laravel-5 
Laravel 5 在vue中调用其他组件的方法
laravel-5vue.jsvuejs2 
Laravel 5 如何在yajra datatable列laravel5.3中显示图像
laravel-5 
Laravel 5 没有身份验证的Laravel登录
laravel-5 
Laravel 5 生产服务器中的Laravel性能问题
laravel-5 
Laravel 5 Laravel 5.4路线简化
laravel-5 
Laravel 5 vue-18n-更改语言时如何强制重新加载计算函数
laravel-5vuejs2internationalization 
Laravel 5 权限不足，无法访问：GET/me/
laravel-5linkedin 
Laravel 5 向laravel中的资源json响应添加状态键和消息键
laravel-5


                                        

                                        
                                        


                                                
                                                        [html]相关推荐
                                                        
HTML：父块底部内的锚块元素？
									Html
							 									Css
							 									Layout
							 
如何使带有注释的HTML代码处于非活动状态
									Html
							 
CSS/XHTML菜单-适用于所有浏览器-IE6帮助
									Html
							 									Css
							 									Internet Explorer
							 									Menu
							 
HTML属性：使用它们可以做哪些有趣的事情？
									Html
							 
Html 2个具有自动文本分隔符的div元素
									Html
							 									Css
							 
Html 在使用grid960时，将网格序列封装在父div中以控制高度
									Html
							 									Css
							 									Layout
							 
Html h2填充和Div定位
									Html
							 									Css
							 
Html 如何创建具有100%宽度但具有动态列布局的表？
									Html
							 									Css
							 
Html 是否可以创建具有半径的轮廓边框？
									Html
							 									Css
							 
如何在nodejs中获取HTML页面？
									Html
							 									Node.js
							 
Html 将下拉列表放置在另一个下拉列表中
									Html
							 
Html 将字体图标附加到文本字符串中的最后一个单词并防止换行
									Html
							 									Css
							 
Html 链接元素的rel属性中的斜杠
									Html
							 									Css
							 
Html 属性"；数据内容id“；舱内
									Html
							 
使用模式验证HTML5电话号码
									Html
							 									Validation
							 
Html 在Google Chrome中设置拼写检查语言
									Html
							 									Google Chrome
							 
Html 如何使引导导航栏在移动菜单上下推整个页面？
									Html
							 									Css
							 									Twitter Bootstrap
							 
Html 在不同浏览器中与Wordpress一起使用字体
									Html
							 									Css
							 									Wordpress
							 									Browser
							 
Html 我如何创建这个倒置的两层边界？
									Html
							 									Css
							 
如何在HTML中显示ImageGridFSProxy？
									Html
							 									Mongodb
							 									Flask
							 
Html 从XSL-FO生成的PDF中不需要的换行符？
									Html
							 									Xml
							 									Pdf
							 									Xslt
							 
Html 如何将自定义内容添加到新的Google站点
									Html
							 									Polymer
							 
Html 如何将我的所有li对齐到一列上？
									Html
							 									Css
							 
Html 如何将图像与a<；的内容对齐；导航>；标签？
									Html
							 									Css
							 
Html 使用vba/excel从yahoo finance中刮取（扩展）财务数据
									Html
							 									Vba
							 
Html 一个flex/grid项为同级设置大小限制
									Html
							 									Css
							 
如何替换堆栈中的html标记以在Blade、Laravel中推送新标记
									Html
							 									Laravel
							 									Replace
							 									Tags
							 
Html 静态网站是否符合任何架构模式的标准？
									Html
							 									Architecture
							 
Html 仪表板网格替代方案
									Html
							 									Css
							 
Html 如何定位图像，使其部分脱离屏幕，而不会出现水平滚动条？
									Html
							 									Css
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Glassfish
Elm
Symfony1
Material Ui
Math
Build
Autodesk Forge
Amazon Web Services
Apache Camel
Botframework
Jakarta Ee
Google Cloud Dataflow
Jqgrid
Electron
Enums
Vbscript
Julia
Xaml
Discord
Calendar
Programming Languages
Arangodb
Protocol Buffers
User Interface
Usb
Jsp
Asp.net Mvc 2
Opencv
Cordova
Visual Studio Code
Facebook
C++ Cli
Sitecore
Css
Grid
Exception
Apache2
Emacs
Google Analytics
Methods
Windows Phone 8.1
Plugins
Alfresco
Codeigniter
Flash
Airflow
Vaadin
Opengl
Lambda
Service
Grep
Sails.js
View
Sql Server 2012
Pine Script
Spring Batch
Reference
Mule
Openlayers 3
D3.js
Terraform
Matrix
Documentation
Twitter Bootstrap
Matplotlib
Shiny
Login
Fortran
Atom Editor
Redirect
Stream
Compression
Core Data
Aurelia
Sms
Xamarin.android
Rally
Windows Runtime
Vuejs2
Playframework 2.0
Sphinx
Google App Engine
Racket
Filter
Seo
Inno Setup
Log4j
Hbase
Openid
Selenium
Mercurial
Marklogic
Next.js
Safari
Single Sign On
Cocoa
Jasmine
Shell
Embedded
Recursion
Azure Functions
Raspberry Pi
Youtube Api
Oop
Jquery Ui
Iis
Linkedin
Swift3
Google Compute Engine
Django Models
Maven
Blackberry
Vb.net
Loops
Google App Maker
Checkbox
Twitter Bootstrap 3
Ocaml
Windows 10
Resharper
Aframe
Lotus Notes
Quickbooks
Silverlight 4.0
Button
Autohotkey
Iphone
Ftp
Internet Explorer 8
Datetime
For Loop
Sapui5
Jasper Reports
Silverlight
Binding
Eclipse Rcp
Struct
Servlets
Ruby On Rails 3.1
Xpath
Couchbase
Windows Phone 8
Windows Phone
Browser
Playframework
Sas
Nlp
Netsuite
Deep Learning
Oracle10g
Assembly
Android Ndk
Yocto
Google Chrome
Winforms
Sequelize.js
Swing
Moodle
C
Drupal
Verilog
Pip
Gnuplot
Frameworks
Twilio
Jetty
Titanium
Notifications
C#
Terminal
Dojo
Server
Three.js
Dynamic
Scikit Learn
Symfony
Yii2
Floating Point
Angular6
Html
Swift
Automated Tests
Function
Menu
Nunit
Octave
Dll
Map
Cmake
Orientdb
Animation
Activemq
Jboss
Reflection
Wolfram Mathematica
Android
Wso2
Mono
Logging
Mod Rewrite
Cucumber


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网