Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/http/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如果页面没有';如果不需要Javascript,什么会阻止它?_Python_Http_Python Requests - Fatal编程技术网

Python 如果页面没有';如果不需要Javascript,什么会阻止它?

Python 如果页面没有';如果不需要Javascript,什么会阻止它?,python,http,python-requests,Python,Http,Python Requests,例如,此URL: 在一个请求中,除了照片和那些div中的所有内容,比如他们的评论等,所有内容都会加载。但是页脚和页眉(一直到照片)会加载他们的个人简历、个人资料图片等 因此,在浏览器中,我禁用了javascript,并将用户代理设置为python requests/1.2.0。页面在浏览器中仍能正常加载 我不明白为什么它不能通过编程HTTP请求加载。所以您有如下代码: import requests as req site = req.get('http://websta.me/n/victor

例如,此URL:

在一个请求中,除了照片和那些div中的所有内容,比如他们的评论等,所有内容都会加载。但是页脚和页眉(一直到照片)会加载他们的个人简历、个人资料图片等

因此,在浏览器中,我禁用了javascript,并将用户代理设置为
python requests/1.2.0
。页面在浏览器中仍能正常加载


我不明白为什么它不能通过编程HTTP请求加载。

所以您有如下代码:

import requests as req
site = req.get('http://websta.me/n/victoria.a3456')
print(site.text)
您可以像这样更改请求的标题

headers = {'':''}
site = req.get('http://websta.me/n/victoria.a3456', headers=headers)
html文件是引用其他文档的文档。这不是zip文件。这些其他文件(图像、视频等)未嵌入html文档中。指示web服务器向您提供html文档,并让浏览器确定如何从该html文件下载链接的文档。浏览器正在后台执行更多工作。我建议你看看网站的其他元素

你可以在网站上看到这些图片。这只是第二次请求下载的问题

import string
string.rfind(site.text, "https://scontent.cdninstagram.com/hphotos-xfa1/t51.2885-15/s320x320/e35/10838359_831976973588137_408868997_n.jpg")
>>>10039

检查
referer
Accept
标题,以及压缩设置(如果是这种情况,您可能会看到一些错误)。@jso有没有办法将我的chrome标题设置为与
wget
requests
相同的标题,这样我就可以知道这是否是我的问题?我经常使用“高级REST客户端”作为一个Chrome扩展,它可以让你定义几乎任何你喜欢的标题。试着稍微修改一下,不幸的是,我没有更好的主意给你。无法复制:我看到了
DenÄrmel voller Asse,doch das Leben spielt
注释和图像配置文件元素。你能详细说明你找不到的元素吗?谢谢