如何在Python请求/美化组中伪造启用的javascript

如何在Python请求/美化组中伪造启用的javascript,python,python-2.7,beautifulsoup,python-requests,Python,Python 2.7,Beautifulsoup,Python Requests,我试图爬网一个网站,它返回一条错误消息,你的js被禁用,你可能是一个机器人。我试图在web浏览器中看到相同的行为,是的,是相同的响应,但是如果启用JavaScript,它将不会影响原始响应,我的意思是原始响应不依赖于JS 所以我在想,如果我能告诉web/http服务器,我的JS已经启用,我不是机器人。 在Python请求库或任何其他Python库中都可以这样做吗 是的,我已经设置了用户代理头,甚至所有其他头,比如主机,语言,连接,等等如果站点只是通过执行一些js来检查javascript是否可以

我试图爬网一个网站,它返回一条错误消息,你的js被禁用,你可能是一个机器人。我试图在web浏览器中看到相同的行为,是的,是相同的响应,但是如果启用JavaScript,它将不会影响原始响应,我的意思是原始响应不依赖于JS

所以我在想,如果我能告诉web/http服务器,我的JS已经启用,我不是机器人。 在Python请求库或任何其他Python库中都可以这样做吗


是的,我已经设置了
用户代理
头,甚至所有其他头,比如
主机
语言
连接
,等等

如果站点只是通过执行一些js来检查javascript是否可以执行,请使用selenium获取页面,然后使用BeautifulSoup解析selenium获得的页面

from bs4 import BeautifulSoup
from selenium import webdriver
driver = webdriver.Firefox()
driver.get('http://your-site/url')

html = driver.page_source
soup = BeautifulSoup(html)
...

页面是否正在执行某个脚本,该脚本会告诉页面JavaScript已禁用?一些没有多少头会绕过的东西。@MikeMcMahon:如果我禁用js,它会返回一些消息。