使用wget和Perl脚本从网页中提取信息_Perl_Wget

使用wget和Perl脚本从网页中提取信息

perl

使用wget和Perl脚本从网页中提取信息,perl,wget,Perl,Wget,这个Perl脚本的目的是使用wget和Perl从网页中提取信息。在本例中，这是我试图从中提取信息的网站：我只想显示标题。比如说, 2.1 - The Ellen Degeneress Show 4.1 - NBC News 7.1 - Hell's Kitchen 就这样到目前为止，这就是我所拥有的，但我不确定我做得对还是错。有没有人能提供一些帮助或建议，如何只显示标题为2.1、4.1和7.1的频道？特别是使用wget和Perl脚本。感谢您的回复，因为我仍在学习Perl 你的主要问题似乎

这个Perl脚本的目的是使用wget和Perl从网页中提取信息。在本例中，这是我试图从中提取信息的网站：

我只想显示标题。比如说,

2.1 - The Ellen Degeneress Show
4.1 - NBC News
7.1 - Hell's Kitchen

就这样

到目前为止，这就是我所拥有的，但我不确定我做得对还是错。有没有人能提供一些帮助或建议，如何只显示标题为2.1、4.1和7.1的频道？特别是使用wget和Perl脚本。感谢您的回复，因为我仍在学习Perl

你的主要问题似乎是看错了表。该页面上有多个表，您可以在创建解析器对象时使用

attribs

参数返回您感兴趣的对象

my $tec = HTML::TableExtract->new(attribs => {id => 'programming_data' });

添加了这些内容后，您的代码将打印所有频道的信息。然后，您需要创建一种方法来识别您感兴趣的频道。我使用了正则表达式：

my @channels = qw(2.1 4.1 7.1);
my $channel_re = '\b(' . join('|', map { quotemeta } @channels) . ')\b';

在主循环中，您可以跳过您不感兴趣的频道：

next unless $rowref->[0] =~ /$channel_re/;

next unless $rowref->[0] =~ /$channel_re/;