使用Perl从HTML页面提取信息_Html_Perl_Parsing

使用Perl从HTML页面提取信息

html perl parsing

使用Perl从HTML页面提取信息,html,perl,parsing,Html,Perl,Parsing,致力于测试基于web的应用程序。基于web的应用程序定期推出新按钮、新选项卡等构建一个能够读取HTML页面并从中提取信息的自动化工具会很好，我想：有哪些按钮按下按钮会把我带到哪里有哪些标签等等我想问一下，是否有人有使用Perl完成类似任务的经验谢谢如果您想对web浏览进行任何自动模拟，应该是您的第一个呼叫端口。从WWW:：Mechanize的概要中：简而言之，Mech是一个用于有状态编程web浏览的Perl模块，用于自动化与网站的交互特色包括：所有HTTP方法高级超链

致力于测试基于web的应用程序。基于web的应用程序定期推出新按钮、新选项卡等

构建一个能够读取HTML页面并从中提取信息的自动化工具会很好，我想：

有哪些按钮
按下按钮会把我带到哪里
有哪些标签
等等

我想问一下，是否有人有使用Perl完成类似任务的经验

谢谢

如果您想对web浏览进行任何自动模拟，应该是您的第一个呼叫端口。从WWW:：Mechanize的概要中：

简而言之，Mech是一个用于有状态编程web浏览的Perl模块，用于自动化与网站的交互

特色包括：

所有HTTP方法
高级超链接和HTML表单支持，无需解析 HTML自己
SSL支持
自动cookies
自定义HTTP头
自动处理重定向
代理
HTTP身份验证

有一整套处理链接的方法——例如——和查找输入的方法——例如——你可以模拟表单填充和其他典型的浏览活动

还有许多用于DOM解析和操作的模块，例如和

简言之，应该有大量的perl模块来完成您想要做的事情，因此不需要编写您自己的框架