Shell 是否可以指示wget只关注带有特定文本的链接?

Shell 是否可以指示wget只关注带有特定文本的链接?,shell,wget,Shell,Wget,我有大约4000页要下载,每一页都有一个到下一页的链接。此链接始终具有相同的文本(和名称属性)。我已经非常彻底地阅读了wget的文档,并且有一些开关可以只从特定的目录/主机下载特定的扩展,等等。我找不到任何东西表明它可以基于链接文本进行过滤 有什么把戏我没看见吗?这个用例似乎很一般,我无法想象我是第一个需要它的人。我必须同意,在wget中不可能通过链接文本过滤链接。URL中是否有任何模式可用于通过-I/-X(目录)或-A/-R(文件名)进行过滤?我看不到任何模式。有某种数据库内部id号,但它不是

我有大约4000页要下载,每一页都有一个到下一页的链接。此链接始终具有相同的文本(和名称属性)。我已经非常彻底地阅读了wget的文档,并且有一些开关可以只从特定的目录/主机下载特定的扩展,等等。我找不到任何东西表明它可以基于链接文本进行过滤


有什么把戏我没看见吗?这个用例似乎很一般,我无法想象我是第一个需要它的人。

我必须同意,在
wget
中不可能通过链接文本过滤链接。URL中是否有任何模式可用于通过
-I
/
-X
(目录)或
-A
/
-R
(文件名)进行过滤?我看不到任何模式。有某种数据库内部id号,但它不是顺序的。。。我认为这是一个pk,其中一些行已被删除。但总是有“下一页”链接,有时还有“继续”链接文本。我已经在bash循环中使用perl对其进行了重新注册,但是我运行的测试使我觉得如果wget自己做的话,速度会有x10的提高。我想我不得不接受它。我可以想象你可以通过将循环移动到perl脚本中来提高性能,因为那时你只需要调用perl解释器一次。我必须同意,
wget
中不可能通过链接文本过滤链接。URL中是否有任何模式可用于通过
-I
/
-X
(目录)或
-A
/
-R
(文件名)进行过滤?我看不到任何模式。有某种数据库内部id号,但它不是顺序的。。。我认为这是一个pk,其中一些行已被删除。但总是有“下一页”链接,有时还有“继续”链接文本。我已经在bash循环中使用perl对其进行了重新注册,但是我运行的测试使我觉得如果wget自己做的话,速度会有x10的提高。我想我将不得不接受它,我可以想象通过将循环移动到perl脚本中可以提高性能,因为这样您只需调用perl解释器一次。