如何使用BeautifulSoup和请求删除动态变量Javascript值
我正在抓取登录页面,我只需要JAVASCRIPT标记中的VAR SALT=variable。 这是网站= 当我阅读这里的所有答案时,使用BeautifulSoup和requests,我可以得到这2个变量(可能是因为它是静态的): var muserid='User ID必须填写'; var mpassword='必须填写密码'强> 但当我尝试刮取这个var SALT=,它会给我所有的var值。 我只需要这个VAR SALT值,没有引号 这里的图片= 我已经在使用re.search、re.compile、re.findall,但我是新手,keep给我错误“objectcannotstring…” 注意:1)我需要帮助,但对使用Selenium不感兴趣如何使用BeautifulSoup和请求删除动态变量Javascript值,javascript,python,beautifulsoup,Javascript,Python,Beautifulsoup,我正在抓取登录页面,我只需要JAVASCRIPT标记中的VAR SALT=variable。 这是网站= 当我阅读这里的所有答案时,使用BeautifulSoup和requests,我可以得到这2个变量(可能是因为它是静态的): var muserid='User ID必须填写'; var mpassword='必须填写密码' 但当我尝试刮取这个var SALT=,它会给我所有的var值。 我只需要这个VAR SALT值,没有引号 这里的图片= 我已经在使用re.search、re.compi
请帮助我,非常感谢您尝试使用re.compile并将
'
添加到您的正则表达式中,然后提取第一个结果。未使用页面响应进行测试。首先验证响应中是否实际存在该字符串
p = re.compile(r"var salt='(.*?)'")
res = p.findall(s.get(URL, headers=HEADERS, timeout=5, verify=False).text)[0]
print(res)
不工作,兄弟。你能给我完整的代码吗?谢谢发生了什么事?
p = re.compile(r"var salt='(.*?)'")
res = p.findall(s.get(URL, headers=HEADERS, timeout=5, verify=False).text)[0]
print(res)