Flash bing视频搜索是如何从这么多不同的网站中提取视频的?

Flash bing视频搜索是如何从这么多不同的网站中提取视频的?,flash,video,bing,Flash,Video,Bing,他们是在反编译flash还是类似的东西?我无法想象他们是如何做到的。只是猜测,但他们可以看到Flash SWF文件连接到了什么(即,根据SWF文件发出的HTTP请求查找FLV url)。一旦他们这样做了,他们可以做两件事中的一件: 1) 将url排队到一个进程,该进程:i)下载FLV,ii)剪断FLV 10秒长,iii)添加淡入/淡出,iv)保存 或 2) 他们每次只需使用原始url直接连接到FLV,只需播放10秒。然后,他们可以在视频上方添加淡入/淡出效果。不过, 我怀疑他们是否会使用第二种方

他们是在反编译flash还是类似的东西?我无法想象他们是如何做到的。

只是猜测,但他们可以看到Flash SWF文件连接到了什么(即,根据SWF文件发出的HTTP请求查找FLV url)。一旦他们这样做了,他们可以做两件事中的一件:

1) 将url排队到一个进程,该进程:i)下载FLV,ii)剪断FLV 10秒长,iii)添加淡入/淡出,iv)保存

2) 他们每次只需使用原始url直接连接到FLV,只需播放10秒。然后,他们可以在视频上方添加淡入/淡出效果。不过,

我怀疑他们是否会使用第二种方法,因为它可能会对人们的服务器造成恼人的峰值,并可能增加延迟。第一种方法允许Bing服务器缓存视频,并将其托管在一个专门用于视频流的可靠位置

更新

想一想,还有另一种方法:

我知道,在PHP中,您可以动态地反编译已编译的SWF。它相当快,这将是提取任何URL的简单方法。当然,微软不会使用PHP,但我敢肯定他们有一个等效的库,用C++编写(我确信他们使用C++)。
但是,即使他们正在寻找对FLV的HTTP请求,他们也可能会在一个轻量级的“浏览器”中运行一个爬虫程序。浏览器需要呈现flash,以便它随后发出HTTP请求,然后它将记录所有的越界请求。这不是一项太难的任务,如果您正在运行自己的服务器,您只需要有一个后台进程,它就可以在那里搜索日志以查找FLV请求。创建自己的浏览器来实现这一点可能听起来令人望而生畏,但实际上相当简单:在C#中,您可以对URL进行HttpRequest,扫描文档中的任何链接,对链接进行排队,请求每个链接,然后以这种方式循环(确保您不访问已经访问过的链接)。在PHP中,您可以卷曲URL并执行相同的操作。无论何时,只要找到SWF链接,就可以将其添加到另一个队列中,该队列可以呈现flash(或对其进行反编译),并找到指向FLV URL的任何链接,然后根据需要对这些链接进行排队。

答案很好,非常有意义,谢谢。知道如何以编程方式检测FLV HTTP请求吗?