Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/perl/11.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用Perl从HTML页面提取信息_Html_Perl_Parsing - Fatal编程技术网

使用Perl从HTML页面提取信息

使用Perl从HTML页面提取信息,html,perl,parsing,Html,Perl,Parsing,致力于测试基于web的应用程序。基于web的应用程序定期推出新按钮、新选项卡等 构建一个能够读取HTML页面并从中提取信息的自动化工具会很好,我想: 有哪些按钮 按下按钮会把我带到哪里 有哪些标签 等等 我想问一下,是否有人有使用Perl完成类似任务的经验 谢谢如果您想对web浏览进行任何自动模拟,应该是您的第一个呼叫端口。从WWW::Mechanize的概要中: 简而言之,Mech是一个用于有状态编程web浏览的Perl模块,用于自动化与网站的交互 特色包括: 所有HTTP方法 高级超链

致力于测试基于web的应用程序。基于web的应用程序定期推出新按钮、新选项卡等

构建一个能够读取HTML页面并从中提取信息的自动化工具会很好,我想:

  • 有哪些按钮
  • 按下按钮会把我带到哪里
  • 有哪些标签
  • 等等
我想问一下,是否有人有使用Perl完成类似任务的经验


谢谢

如果您想对web浏览进行任何自动模拟,应该是您的第一个呼叫端口。从WWW::Mechanize的概要中:

简而言之,Mech是一个用于有状态编程web浏览的Perl模块,用于自动化与网站的交互

特色包括:

  • 所有HTTP方法
  • 高级超链接和HTML表单支持,无需解析 HTML自己
  • SSL支持
  • 自动cookies
  • 自定义HTTP头
  • 自动处理重定向
  • 代理
  • HTTP身份验证
有一整套处理链接的方法——例如——和查找输入的方法——例如——你可以模拟表单填充和其他典型的浏览活动

还有许多用于DOM解析和操作的模块,例如和

简言之,应该有大量的perl模块来完成您想要做的事情,因此不需要编写您自己的框架