使用Perl从url提取HTML
我想提取TWiki的HTML代码(我有谁的URL)。最好的方法是什么使用Perl从url提取HTML,html,perl,twiki,Html,Perl,Twiki,我想提取TWiki的HTML代码(我有谁的URL)。最好的方法是什么 此外,一旦我提取了HTML代码,我就需要在Google站点上托管的站点中将其输出。可能吗 听起来您需要CPAN模块 获取HTML页面的一种非常简单的方法是模块。如果必须执行更复杂的导航流程,请使用。然后,如果您需要解析HTML代码,@brian解决方案很好。我不推荐使用HTML::Parser,该模块需要大量的代码来实现简单的事情。更好的声明性:(CSS选择器),(XPath)谢谢。LWP::Simple工作得很好。但是有人知
此外,一旦我提取了HTML代码,我就需要在Google站点上托管的站点中将其输出。可能吗 听起来您需要CPAN模块
获取HTML页面的一种非常简单的方法是模块。如果必须执行更复杂的导航流程,请使用。然后,如果您需要解析HTML代码,@brian解决方案很好。我不推荐使用HTML::Parser,该模块需要大量的代码来实现简单的事情。更好的声明性:(CSS选择器),(XPath)谢谢。LWP::Simple工作得很好。但是有人知道我第二个问题的答案吗。我似乎根本无法访问我的网站。
use HTML::Parser ();
# Create parser object
$p = HTML::Parser->new( api_version => 3,
start_h => [\&start, "tagname, attr"],
end_h => [\&end, "tagname"],
marked_sections => 1,
);
# Parse directly from file
$p->parse_file("foo.html");