linux上的无头、可编写脚本的Firefox/Webkit?

linux上的无头、可编写脚本的Firefox/Webkit?,firefox,webkit,screen-scraping,headless-browser,Firefox,Webkit,Screen Scraping,Headless Browser,我希望自动化一些web交互,即定期从安全网站下载文件。这主要包括输入我的用户名/密码并导航到适当的URL 我尝试用Python编写简单的脚本,然后编写更复杂的脚本,结果发现这个网站使用了一些令人讨厌的javascript和基于flash的登录机制,这使得我的方法毫无用处 然后我试了一下,但似乎也不管用。我怀疑使用闪光灯是个问题 我真的不想再去想它了,所以我倾向于编写一个真正的浏览器来登录并获取我需要的文件 要求如下: 在linux服务器上运行,即不运行X。如果我真的需要X,我可以做到,但我不会高

我希望自动化一些web交互,即定期从安全网站下载文件。这主要包括输入我的用户名/密码并导航到适当的URL

我尝试用Python编写简单的脚本,然后编写更复杂的脚本,结果发现这个网站使用了一些令人讨厌的javascript和基于flash的登录机制,这使得我的方法毫无用处

然后我试了一下,但似乎也不管用。我怀疑使用闪光灯是个问题

我真的不想再去想它了,所以我倾向于编写一个真正的浏览器来登录并获取我需要的文件

要求如下:

在linux服务器上运行,即不运行X。如果我真的需要X,我可以做到,但我不会高兴的。 要可靠。我想开始这件事,再也不去想它了。 可以编写脚本。没有什么太复杂了,但我应该能够告诉浏览器要采取的各种步骤和要访问的页面。
对于无头、无X脚本的浏览器,有什么好的工具包吗?你试过类似的东西吗?如果是的话,你有什么智慧的话吗?

我不知道如何进行flash交互,我也很感兴趣,但是对于html/javascript你可以使用


要使无头+可脚本浏览器在Linux上工作,您可以使用

虽然是带有隐藏浏览器组件面板的gui应用程序,但我还是使用IE嵌入式浏览器完成了相关任务。实际上,您可以选择任何一种方式并切断输出逻辑。导航应该通过触发类似脚本的事件来完成

你可以用。它是FirefoxGecko引擎的无头版本。它将浏览器转换为RESTful服务器,可以接受请求获取url。所以它解析html,将其表示为DOM,等待所有脚本执行的定义延迟

它在linux上工作。我想您可以使用JS和丰富的XULrunner功能轻松地为您的目标扩展它。

怎么样

你试过了吗?它将允许您使用Firefox扩展记录使用场景,稍后可以使用多种不同的方法播放


编辑:我刚刚意识到这是一个很晚的回复

看一看。该项目包括WebKit的无头实现。

为了实现这一点,我只需编写发布到CouchDB及其应用程序的Chrome扩展。将coach添加到清单中的权限,以允许跨域XHR

我来到这里是为了寻找一个无头的替代品来代替我一直在做的事情;找到这根线后,我打算在某个时候试试撬棍


另外,考虑到这个网站的奇怪特性,我不禁想知道你是否可以利用一些安全漏洞绕过Flash和Javascript。

Thansk Richard,看起来不错,让我试试。PhantomJS是迄今为止最容易集成的,并且正在开发与自动化测试框架集成的方法。是的,但是,如果你想模拟登录网站和使用cookies之类的东西,祝你好运!Phantomjs需要一个X服务器@pyrony来解决这个问题:PhantomJS现在支持持久cookie,不需要X11服务器(不确定何时),但最新的1.5.0在我的无头linux服务器上运行良好Crowbar支持POST http请求吗?文件很差。。。