使用wget和Perl脚本从网页中提取信息

使用wget和Perl脚本从网页中提取信息,perl,wget,Perl,Wget,这个Perl脚本的目的是使用wget和Perl从网页中提取信息。在本例中,这是我试图从中提取信息的网站: 我只想显示标题。比如说, 2.1 - The Ellen Degeneress Show 4.1 - NBC News 7.1 - Hell's Kitchen 就这样 到目前为止,这就是我所拥有的,但我不确定我做得对还是错。有没有人能提供一些帮助或建议,如何只显示标题为2.1、4.1和7.1的频道?特别是使用wget和Perl脚本。感谢您的回复,因为我仍在学习Perl 你的主要问题似乎

这个Perl脚本的目的是使用wget和Perl从网页中提取信息。在本例中,这是我试图从中提取信息的网站:

我只想显示标题。比如说,

2.1 - The Ellen Degeneress Show
4.1 - NBC News
7.1 - Hell's Kitchen
就这样

到目前为止,这就是我所拥有的,但我不确定我做得对还是错。有没有人能提供一些帮助或建议,如何只显示标题为2.1、4.1和7.1的频道?特别是使用wget和Perl脚本。感谢您的回复,因为我仍在学习Perl



你的主要问题似乎是看错了表。该页面上有多个表,您可以在创建解析器对象时使用
attribs
参数返回您感兴趣的对象

my $tec = HTML::TableExtract->new(attribs => {id => 'programming_data' });
添加了这些内容后,您的代码将打印所有频道的信息。然后,您需要创建一种方法来识别您感兴趣的频道。我使用了正则表达式:

my @channels = qw(2.1 4.1 7.1);
my $channel_re = '\b(' . join('|', map { quotemeta } @channels) . ')\b';
在主循环中,您可以跳过您不感兴趣的频道:

next unless $rowref->[0] =~ /$channel_re/;
next unless $rowref->[0] =~ /$channel_re/;