Javascript 如果下一页使用java脚本加载,并且没有URL更改,那么如何使用python刮取下一页数据?
我正在尝试使用python来刮取网页。我已经成功地抓取了第一页,但我无法进入下一页,因为下一页URL相同,下一页正在加载javascriptJavascript 如果下一页使用java脚本加载,并且没有URL更改,那么如何使用python刮取下一页数据?,javascript,python,web-scraping,Javascript,Python,Web Scraping,我正在尝试使用python来刮取网页。我已经成功地抓取了第一页,但我无法进入下一页,因为下一页URL相同,下一页正在加载javascript import requests import bs4 as bs url ='https://scamalert.sg/scam-details' r = requests.get(url) htmlcontent = r.content soup = bs.BeautifulSoup(htmlcontent, 'html.parser') for t
import requests
import bs4 as bs
url ='https://scamalert.sg/scam-details'
r = requests.get(url)
htmlcontent = r.content
soup = bs.BeautifulSoup(htmlcontent, 'html.parser')
for tag in soup.find_all('h4',{"class":"card-title"}):
print (tag.text)
[网页HTML][1]
[1]: https://i.stack.imgur.com/8zV9y.png
二,
import json
import requests
base = 'https://scamalert.sg{}'
link = 'https://scamalert.sg/scam-details/GetStoryListAjax/'
payload = {
'scamType': '',
'year': '',
'month': '',
'sortBy': 'Latest'
}
page = 1
while True:
payload['page'] = page
r = requests.post(link,data=payload)
items = json.loads(r.json()['result'])['StoryList']
if len(items)<=1:break
for item in items:
print(item['Title'],base.format(item['Url']))
page+=1
导入json
导入请求
基地组织https://scamalert.sg{}'
链接https://scamalert.sg/scam-details/GetStoryListAjax/'
有效载荷={
“scamType”:“,
“年”:“,
“月”:“,
“sortBy”:“最新”
}
页码=1
尽管如此:
有效载荷['page']=第页
r=请求.post(链接,数据=有效负载)
items=json.loads(r.json()['result'])['StoryList']
如果在这种情况下您需要使用len(项目)Selenium
,先生,您能提供一些示例吗?您是否尝试过@vpnkumar下面的脚本?反馈是什么?