Python request.get搜索结果第二页的url
我正在尝试使用request.geturl从服务器获取url的响应。 以下代码适用于搜索结果第一页的url:Python request.get搜索结果第二页的url,python,http,url,beautifulsoup,python-requests,Python,Http,Url,Beautifulsoup,Python Requests,我正在尝试使用request.geturl从服务器获取url的响应。 以下代码适用于搜索结果第一页的url: r = requests.get("https://www.epocacosmeticos.com.br/perfumes") soup = BeautifulSoup(r.text) 然而,当我尝试对搜索结果的第二个页面的url使用相同的代码时 它返回第一页的响应。它忽略URL末尾的“2”。如何获得搜索结果第二页的响应?该网站似乎使用了动态html。因此,第二个结果页面不是新页面,而
r = requests.get("https://www.epocacosmeticos.com.br/perfumes")
soup = BeautifulSoup(r.text)
然而,当我尝试对搜索结果的第二个页面的url使用相同的代码时
它返回第一页的响应。它忽略URL末尾的“2”。如何获得搜索结果第二页的响应?该网站似乎使用了动态html。因此,第二个结果页面不是新页面,而是重新加载搜索内容的同一页面
您可能无法仅使用请求进行废弃。这可能需要一个浏览器。使用或是此作业的好选择,之后可以使用beautifulSoup进行解析。您可以使用web代理查看页面发出的请求。单击第2页按钮时,这是在后台发送的内容: 因此,如果你想正确地抓取网站,这是你需要查询的url。 BurpSuite还允许您处理请求,因此您可以尝试更改请求,就像将2更改为3一样,并查看是否获得预期结果
r = requests.get("https://www.epocacosmeticos.com.br/perfumes#2")
soup = BeautifulSoup(r.text)
GET /buscapagina?fq=C%3a%2f1000001%2f&PS=16&sl=f804bbc5-5fa8-4b8b-b93a-641c059b35b3&cc=4&sm=0&PageNumber=2 HTTP/1.1