如何使用Perl从HTML文件中提取链接?
我有一些与链接的输入,我想打开该链接。例如,我有一个HTML文件,希望找到文件中的所有链接,并在Excel电子表格中打开它们的内容。这听起来像是一个工作。它为获取和研究网页提供了一个相当高级的界面如何使用Perl从HTML文件中提取链接?,perl,excel,Perl,Excel,我有一些与链接的输入,我想打开该链接。例如,我有一个HTML文件,希望找到文件中的所有链接,并在Excel电子表格中打开它们的内容。这听起来像是一个工作。它为获取和研究网页提供了一个相当高级的界面 一旦您阅读了文档,我想您会有一个很好的想法如何去做。听起来您想从我的模块中获得linktractor脚本 你可能也对我的剧本感兴趣。我很久很久以前就写过这篇文章,是为了做一些类似的事情。我并不真的推荐它,因为现在其他工具要好得多,但您至少可以看看代码 他们是你的朋友 这也很不错: use Mojo::
一旦您阅读了文档,我想您会有一个很好的想法如何去做。听起来您想从我的模块中获得linktractor脚本 你可能也对我的剧本感兴趣。我很久很久以前就写过这篇文章,是为了做一些类似的事情。我并不真的推荐它,因为现在其他工具要好得多,但您至少可以看看代码 他们是你的朋友 这也很不错:
use Mojo::UserAgent
print Mojo::UserAgent
->new
->get( $ARGV[0] )
->res
->dom->find( "a" )
->map( attr => "href" )
->join( "\n" );
还有:
或者,从cli:
$ perl -MWeb::Query -E'say for wq(shift)->find("a")->attr("href")' \
http://techblog.babyl.ca
我以前也用过这种方式(当文件不是HTML时)。为什么你的每一篇文章都必须这样格式化?为什么?你是在问如何从某个html文件中获取链接列表吗?或者你是在问如何跟踪链接?或者,您是在问如何将某些内容输入Excel电子表格?我读取它的方式,他/她希望从链接到给定页面的页面中提取数据,并将结果放入Excel文档中。我希望打开链接并读取html文件中的内容。使用WWW::Mechanize;我的$mech=WWW::Mechanize->new(自动检查=>1)$机械->获取(“”);打印$mech->content;获取错误获取错误获取:无法连接到www.google.com:80(连接:未知错误)我想知道哪里出了问题。google.com很特别。它不喜欢机器人。然而,如果你连电话都不能接通,听起来好像你有网络问题。
$ perl -MWeb::Query -E'say for wq(shift)->find("a")->attr("href")' \
http://techblog.babyl.ca