如何使用Perl从HTML文件中提取链接？_Perl_Excel

如何使用Perl从HTML文件中提取链接？

perl excel

如何使用Perl从HTML文件中提取链接？,perl,excel,Perl,Excel,我有一些与链接的输入，我想打开该链接。例如，我有一个HTML文件，希望找到文件中的所有链接，并在Excel电子表格中打开它们的内容。这听起来像是一个工作。它为获取和研究网页提供了一个相当高级的界面一旦您阅读了文档，我想您会有一个很好的想法如何去做。听起来您想从我的模块中获得linktractor脚本你可能也对我的剧本感兴趣。我很久很久以前就写过这篇文章，是为了做一些类似的事情。我并不真的推荐它，因为现在其他工具要好得多，但您至少可以看看代码他们是你的朋友这也很不错： use Mojo::

我有一些与链接的输入，我想打开该链接。例如，我有一个HTML文件，希望找到文件中的所有链接，并在Excel电子表格中打开它们的内容。

这听起来像是一个工作。它为获取和研究网页提供了一个相当高级的界面

一旦您阅读了文档，我想您会有一个很好的想法如何去做。

听起来您想从我的模块中获得linktractor脚本

你可能也对我的剧本感兴趣。我很久很久以前就写过这篇文章，是为了做一些类似的事情。我并不真的推荐它，因为现在其他工具要好得多，但您至少可以看看代码

他们是你的朋友

这也很不错：

use Mojo::UserAgent

print Mojo::UserAgent
    ->new
    ->get( $ARGV[0] )
    ->res
    ->dom->find( "a" )
    ->map( attr => "href" )
    ->join( "\n" );

还有：

或者，从cli：

$ perl -MWeb::Query -E'say for wq(shift)->find("a")->attr("href")' \
       http://techblog.babyl.ca

我以前也用过这种方式（当文件不是HTML时）。

为什么你的每一篇文章都必须这样格式化？为什么？你是在问如何从某个html文件中获取链接列表吗？或者你是在问如何跟踪链接？或者，您是在问如何将某些内容输入Excel电子表格？我读取它的方式，他/她希望从链接到给定页面的页面中提取数据，并将结果放入Excel文档中。我希望打开链接并读取html文件中的内容。使用WWW:：Mechanize；我的$mech=WWW:：Mechanize->new（自动检查=>1）$机械->获取（“”）；打印$mech->content；获取错误获取错误获取：无法连接到www.google.com:80（连接：未知错误）我想知道哪里出了问题。google.com很特别。它不喜欢机器人。然而，如果你连电话都不能接通，听起来好像你有网络问题。

$ perl -MWeb::Query -E'say for wq(shift)->find("a")->attr("href")' \
       http://techblog.babyl.ca