Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/345.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python request.get搜索结果第二页的url_Python_Http_Url_Beautifulsoup_Python Requests - Fatal编程技术网

Python request.get搜索结果第二页的url

Python request.get搜索结果第二页的url,python,http,url,beautifulsoup,python-requests,Python,Http,Url,Beautifulsoup,Python Requests,我正在尝试使用request.geturl从服务器获取url的响应。 以下代码适用于搜索结果第一页的url: r = requests.get("https://www.epocacosmeticos.com.br/perfumes") soup = BeautifulSoup(r.text) 然而,当我尝试对搜索结果的第二个页面的url使用相同的代码时 它返回第一页的响应。它忽略URL末尾的“2”。如何获得搜索结果第二页的响应?该网站似乎使用了动态html。因此,第二个结果页面不是新页面,而

我正在尝试使用request.geturl从服务器获取url的响应。 以下代码适用于搜索结果第一页的url:

r = requests.get("https://www.epocacosmeticos.com.br/perfumes")
soup = BeautifulSoup(r.text)
然而,当我尝试对搜索结果的第二个页面的url使用相同的代码时


它返回第一页的响应。它忽略URL末尾的“2”。如何获得搜索结果第二页的响应?

该网站似乎使用了动态html。因此,第二个结果页面不是新页面,而是重新加载搜索内容的同一页面


您可能无法仅使用请求进行废弃。这可能需要一个浏览器。使用或是此作业的好选择,之后可以使用beautifulSoup进行解析。

您可以使用web代理查看页面发出的请求。单击第2页按钮时,这是在后台发送的内容:

因此,如果你想正确地抓取网站,这是你需要查询的url。 BurpSuite还允许您处理请求,因此您可以尝试更改请求,就像将2更改为3一样,并查看是否获得预期结果

r = requests.get("https://www.epocacosmeticos.com.br/perfumes#2")
soup = BeautifulSoup(r.text)
GET /buscapagina?fq=C%3a%2f1000001%2f&PS=16&sl=f804bbc5-5fa8-4b8b-b93a-641c059b35b3&cc=4&sm=0&PageNumber=2 HTTP/1.1