Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/heroku/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Web crawler 构建自动网络爬虫_Web Crawler - Fatal编程技术网

Web crawler 构建自动网络爬虫

Web crawler 构建自动网络爬虫,web-crawler,Web Crawler,我正在构建一个web应用程序爬虫,它不仅可以查找web应用程序中的所有链接或页面,还可以执行应用程序中允许的所有操作(例如按钮、填写表单、注意DOM中的更改,即使它们没有触发请求等) 基本上,这是一种“浏览器模拟器” 我发现WebKit是实现我的爬虫程序的一个很好的选择,因为它拥有所有需要的技术(Javascript引擎、解析器、DOM操作等),但作为一个功能齐全的浏览器,它似乎有点过分了 您知道有任何工具包可以提供上述功能吗?我通过PyQt使用webkit解析JavaScript,然后与之交互

我正在构建一个web应用程序爬虫,它不仅可以查找web应用程序中的所有链接或页面,还可以执行应用程序中允许的所有操作(例如按钮、填写表单、注意DOM中的更改,即使它们没有触发请求等)

基本上,这是一种“浏览器模拟器”

我发现WebKit是实现我的爬虫程序的一个很好的选择,因为它拥有所有需要的技术(Javascript引擎、解析器、DOM操作等),但作为一个功能齐全的浏览器,它似乎有点过分了


您知道有任何工具包可以提供上述功能吗?

我通过PyQt使用webkit解析JavaScript,然后与之交互。

我通过PyQt使用webkit解析JavaScript,然后与之交互。

如果您在mac上,请尝试使用fake app


如果你在mac电脑上,试试假冒的应用程序