Browser wget和浏览器wireshark流量之间的差异

Browser wget和浏览器wireshark流量之间的差异,browser,wget,traffic,webautomation,cap,Browser,Wget,Traffic,Webautomation,Cap,我正在尝试使用尽可能接近浏览器的Wireshark输出 手动,通过wget或urllib 输出是不同的,我想知道为什么,我如何克服这一点 谢谢 有几件事 浏览器: 可能有几个特定的标题(useragent、cookies、referer、misc.pplugins、no track) 请求所有子元素/脚本/资源,可能在同一连接上(保持活动状态) 可以请求Gzip数据流作为回报 WGet: 默认情况下具有最少的头(useragent),但可以使用/更改其他具有参数的头 通常为1-off,仅请求主h

我正在尝试使用尽可能接近浏览器的Wireshark输出 手动,通过wget或urllib

输出是不同的,我想知道为什么,我如何克服这一点


谢谢

有几件事

浏览器:
可能有几个特定的标题(useragent、cookies、referer、misc.pplugins、no track) 请求所有子元素/脚本/资源,可能在同一连接上(保持活动状态) 可以请求Gzip数据流作为回报

WGet:
默认情况下具有最少的头(useragent),但可以使用/更改其他具有参数的头 通常为1-off,仅请求主html而不请求其子资源


如果您看到的是不同的主HTML,则该站点可能是基于useragent和/或Cookie(例如“登录”)的服务器端脚本定制内容。

wget主要用于获取整个或部分网站以供脱机查看,或用于从HTTP或FTP服务器快速下载单个文件

浏览器请求包含HTTP头,如用户代理、引用器等

如果您想将wget模拟为类似浏览器的请求,可以将HTTP头与wget请求一起传递

像这样的-


#wget--header=“用户代理:Mozilla/5.0(Windows NT 5.1;rv:23.0)Gecko/20100101 Firefox/23.0”--header=“接受:image/png,image/;q=0.8,/*;q=0.5”--header=“接受语言:en-US,en;q=0.5”--header=“接受编码:gzip,deflate”--header=“Referer:

感谢您的帮助:)它确实有帮助。谢谢:)