从FlashWeb应用程序浏览和抓取内容

从FlashWeb应用程序浏览和抓取内容,flash,screen-scraping,Flash,Screen Scraping,我需要一个工具,我可以指向一个基于flash的网站,浏览它,并检查给定页面上的内容 我不认为我可以只用selenium就做到这一点,因为我不能通过XPath瞄准flash应用程序中的元素 还有其他人有什么想法吗?有两种方法。如果要查找的数据位于swf内,则必须下载swf并使用反编译器提取数据 如果数据是外部的,您可以使用Firebug查看调用并尝试对其进行反向工程。关于,内容很少位于SWF文件中。SWF文件通常充满了ActionScript。您不会期望在JavaScript文件中找到电话号码列表

我需要一个工具,我可以指向一个基于flash的网站,浏览它,并检查给定页面上的内容

我不认为我可以只用selenium就做到这一点,因为我不能通过XPath瞄准flash应用程序中的元素


还有其他人有什么想法吗?

有两种方法。如果要查找的数据位于swf内,则必须下载swf并使用反编译器提取数据

如果数据是外部的,您可以使用Firebug查看调用并尝试对其进行反向工程。

关于,内容很少位于SWF文件中。SWF文件通常充满了ActionScript。您不会期望在JavaScript文件中找到电话号码列表

Firebug可能会用来识别您所关注的特定内容,但使用Charles Proxy或screen scraper的内置代理来代理站点可能会更好

在导航站点时,您可能需要设置刮板,以便它发出特定请求,以获得某些值,然后需要在后续请求中使用这些值。同样,代理网站不仅可能会显示您所关注的内容,而且还会显示您需要哪些数据才能提出正确的请求,以及这些请求中应该包含哪些数据

使用SWF文件可能感觉像一个黑盒子,但您可以尝试使用showmycode.com或Elima的Trillix Flash反编译程序反编译不同的SWF文件。请记住,ActionScript主要只是JavaScript。如果需要,可以将现有AS放入JavaScript解析器中,以便复制其中一个SWF文件中发生的行为。屏幕刮刀有这种能力内置

如果您正在处理一个通过AMF促进客户端(Flash电影)和服务器之间交互的站点,那么Charles是一个很好的选择,因为它有一个内置的AMF反序列化器(一件罕见的事情)