Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/perl/9.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何使用Perl从HTML文件中提取链接?_Perl_Excel - Fatal编程技术网

如何使用Perl从HTML文件中提取链接?

如何使用Perl从HTML文件中提取链接?,perl,excel,Perl,Excel,我有一些与链接的输入,我想打开该链接。例如,我有一个HTML文件,希望找到文件中的所有链接,并在Excel电子表格中打开它们的内容。这听起来像是一个工作。它为获取和研究网页提供了一个相当高级的界面 一旦您阅读了文档,我想您会有一个很好的想法如何去做。听起来您想从我的模块中获得linktractor脚本 你可能也对我的剧本感兴趣。我很久很久以前就写过这篇文章,是为了做一些类似的事情。我并不真的推荐它,因为现在其他工具要好得多,但您至少可以看看代码 他们是你的朋友 这也很不错: use Mojo::

我有一些与链接的输入,我想打开该链接。例如,我有一个HTML文件,希望找到文件中的所有链接,并在Excel电子表格中打开它们的内容。

这听起来像是一个工作。它为获取和研究网页提供了一个相当高级的界面


一旦您阅读了文档,我想您会有一个很好的想法如何去做。

听起来您想从我的模块中获得linktractor脚本

你可能也对我的剧本感兴趣。我很久很久以前就写过这篇文章,是为了做一些类似的事情。我并不真的推荐它,因为现在其他工具要好得多,但您至少可以看看代码

他们是你的朋友

这也很不错:

use Mojo::UserAgent

print Mojo::UserAgent
    ->new
    ->get( $ARGV[0] )
    ->res
    ->dom->find( "a" )
    ->map( attr => "href" )
    ->join( "\n" );
还有:

或者,从cli:

$ perl -MWeb::Query -E'say for wq(shift)->find("a")->attr("href")' \
       http://techblog.babyl.ca

我以前也用过这种方式(当文件不是HTML时)。

为什么你的每一篇文章都必须这样格式化?为什么?你是在问如何从某个html文件中获取链接列表吗?或者你是在问如何跟踪链接?或者,您是在问如何将某些内容输入Excel电子表格?我读取它的方式,他/她希望从链接到给定页面的页面中提取数据,并将结果放入Excel文档中。我希望打开链接并读取html文件中的内容。使用WWW::Mechanize;我的$mech=WWW::Mechanize->new(自动检查=>1)$机械->获取(“”);打印$mech->content;获取错误获取错误获取:无法连接到www.google.com:80(连接:未知错误)我想知道哪里出了问题。google.com很特别。它不喜欢机器人。然而,如果你连电话都不能接通,听起来好像你有网络问题。
$ perl -MWeb::Query -E'say for wq(shift)->find("a")->attr("href")' \
       http://techblog.babyl.ca