使用Perl从url提取HTML_Html_Perl_Twiki

使用Perl从url提取HTML

html perl

使用Perl从url提取HTML,html,perl,twiki,Html,Perl,Twiki,我想提取TWiki的HTML代码（我有谁的URL）。最好的方法是什么此外，一旦我提取了HTML代码，我就需要在Google站点上托管的站点中将其输出。可能吗听起来您需要CPAN模块获取HTML页面的一种非常简单的方法是模块。如果必须执行更复杂的导航流程，请使用。然后，如果您需要解析HTML代码，@brian解决方案很好。我不推荐使用HTML:：Parser，该模块需要大量的代码来实现简单的事情。更好的声明性：（CSS选择器），（XPath）谢谢。LWP:：Simple工作得很好。但是有人知

我想提取TWiki的HTML代码（我有谁的URL）。最好的方法是什么

此外，一旦我提取了HTML代码，我就需要在Google站点上托管的站点中将其输出。可能吗

听起来您需要CPAN模块

获取HTML页面的一种非常简单的方法是模块。如果必须执行更复杂的导航流程，请使用。然后，如果您需要解析HTML代码，@brian解决方案很好。

我不推荐使用HTML:：Parser，该模块需要大量的代码来实现简单的事情。更好的声明性：（CSS选择器），（XPath）谢谢。LWP:：Simple工作得很好。但是有人知道我第二个问题的答案吗。我似乎根本无法访问我的网站。

use HTML::Parser ();

 # Create parser object
 $p = HTML::Parser->new( api_version => 3,
                         start_h => [\&start, "tagname, attr"],
                         end_h   => [\&end,   "tagname"],
                         marked_sections => 1,
                       );
# Parse directly from file
 $p->parse_file("foo.html");