Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/design-patterns/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Web crawler app:/百科全书df.swf-是谁/什么?_Web Crawler_Bots_Statistics - Fatal编程技术网

Web crawler app:/百科全书df.swf-是谁/什么?

Web crawler app:/百科全书df.swf-是谁/什么?,web-crawler,bots,statistics,Web Crawler,Bots,Statistics,试图在统计日志上做一些侦探工作。43%的点击来自推荐人应用程序:/encyclopldf.swf 一个典型的日志条目是178.146.205.174---[29/Jan/2011:23:50:37-0800]“GET/filename.pdf HTTP/1.1”200 86571“app:/encyclopedf.swf”“Mozilla/5.0(Windows;U;en-US)AppleWebKit/531.9(KHTML,像Gecko)AdobeAIR/2.5.1” 这一个恰好是google

试图在统计日志上做一些侦探工作。43%的点击来自推荐人应用程序:/encyclopldf.swf

一个典型的日志条目是178.146.205.174---[29/Jan/2011:23:50:37-0800]“GET/filename.pdf HTTP/1.1”200 86571“app:/encyclopedf.swf”“Mozilla/5.0(Windows;U;en-US)AppleWebKit/531.9(KHTML,像Gecko)AdobeAIR/2.5.1”

这一个恰好是googlebot crawl-66-249-67-204.googlebot.com,但它们来自世界各地

真正的问题是,是否有人在为某种应用程序窃取内容

在任何地方都找不到百科全书df.swf的任何参考,但我打赌这里有人知道答案


提前感谢

我承认这不是我有丰富经验的领域,所以我可能完全错了,但可能是第三方网站上的flash内容发出了请求


提出请求的主机也可能安装了一个应用程序或浏览器扩展(EncycloPDF?),该应用程序或浏览器扩展增加了浏览器的用户代理价值,以与Windows Media Center、.NET Framework和Silverlight在Windows上所做的相同的方式向服务器宣布它的存在,几周后它就值了,答案是这样的。有人编写并正在销售一个应用程序,该应用程序使用该网站的PDF文件进行窃取,并通过该应用程序将其包含在实时视图中

这件事是在一位购买了该应用程序,但也喜欢该网站提供的免费PDF的人注意到发生了什么并报告了这件事后曝光的


对.htaccess文件进行一点编辑,现在他们加载的每个歌曲文件都会被重定向到一个PDF文件,上面写着“对不起,此材料未经许可使用。您可以从……免费获得它”

谢谢。是的,我也想到了同样的事情,但我试着放大更多关于它可能是谁/什么的信息。但这并不完全适合谷歌机器人也使用该推荐人