Browser wget和浏览器wireshark流量之间的差异_Browser_Wget_Traffic_Webautomation_Cap

Browser wget和浏览器wireshark流量之间的差异

browser

Browser wget和浏览器wireshark流量之间的差异,browser,wget,traffic,webautomation,cap,Browser,Wget,Traffic,Webautomation,Cap,我正在尝试使用尽可能接近浏览器的Wireshark输出手动，通过wget或urllib 输出是不同的，我想知道为什么，我如何克服这一点谢谢有几件事浏览器：可能有几个特定的标题（useragent、cookies、referer、misc.pplugins、no track）请求所有子元素/脚本/资源，可能在同一连接上（保持活动状态）可以请求Gzip数据流作为回报 WGet: 默认情况下具有最少的头（useragent），但可以使用/更改其他具有参数的头通常为1-off，仅请求主h

我正在尝试使用尽可能接近浏览器的Wireshark输出手动，通过wget或urllib

输出是不同的，我想知道为什么，我如何克服这一点

谢谢

有几件事

浏览器：
可能有几个特定的标题（useragent、cookies、referer、misc.pplugins、no track）请求所有子元素/脚本/资源，可能在同一连接上（保持活动状态）可以请求Gzip数据流作为回报

WGet:
默认情况下具有最少的头（useragent），但可以使用/更改其他具有参数的头通常为1-off，仅请求主html而不请求其子资源

如果您看到的是不同的主HTML，则该站点可能是基于useragent和/或Cookie（例如“登录”）的服务器端脚本定制内容。

wget主要用于获取整个或部分网站以供脱机查看，或用于从HTTP或FTP服务器快速下载单个文件

浏览器请求包含HTTP头，如用户代理、引用器等

如果您想将wget模拟为类似浏览器的请求，可以将HTTP头与wget请求一起传递

像这样的-

#wget--header=“用户代理：Mozilla/5.0（Windows NT 5.1；rv:23.0）Gecko/20100101 Firefox/23.0”--header=“接受：image/png，image/；q=0.8，/*；q=0.5”--header=“接受语言：en-US，en；q=0.5”--header=“接受编码：gzip，deflate”--header=“Referer:

感谢您的帮助：）它确实有帮助。谢谢：）