Python 3.x 网页没有';在python代码中,当通过bot打开或通过任何其他方法请求时,不能加载
我正在尝试刮取而不是非法使用,我只是想制作一个简单的脚本来查找与我的搜索匹配的酒店 但问题是我甚至无法使用任何机器人加载网页。它只是不加载 以下是我已经尝试过的一些方法。 1-使用过的硒 2-使用刮擦式框架获得数据 3-使用的python请求库Python 3.x 网页没有';在python代码中,当通过bot打开或通过任何其他方法请求时,不能加载,python-3.x,selenium,web-scraping,scrapy,python-requests,
google-chrome-devtools,Python 3.x,Selenium,Web Scraping,Scrapy,Python Requests,
google Chrome Devtools,我正在尝试刮取而不是非法使用,我只是想制作一个简单的脚本来查找与我的搜索匹配的酒店 但问题是我甚至无法使用任何机器人加载网页。它只是不加载 以下是我已经尝试过的一些方法。 1-使用过的硒 2-使用刮擦式框架获得数据 3-使用的python请求库 from selenium import webdriver driver = webdriver.Chrome() driver.get("https://www.hyatt.com") driver.close() 我只想
from selenium import webdriver
driver = webdriver.Chrome()
driver.get("https://www.hyatt.com")
driver.close()
我只想让页面自行加载。剩下的我会处理。我对您的代码进行了一些调整,并在我的末尾运行了相同的测试:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
options = webdriver.ChromeOptions()
options.add_argument("start-maximized")
# options.add_argument('disable-infobars')
driver = webdriver.Chrome(chrome_options=options, executable_path=r'C:\WebDrivers\chromedriver.exe')
driver.get("https://www.hyatt.com")
WebDriverWait(driver, 20).until(EC.title_contains("Hyatt"))
print(driver.title)
driver.quit()
最后我遇到了同样的问题。我甚至无法加载网页。但当我检查控制台时,其中的错误清楚地表明:
加载资源失败:服务器响应状态为404()
快照:
404找不到 客户端错误响应代码表示服务器找不到请求的资源。指向404页面的链接通常被称为断开或死链接,并且可能会受到攻击 404状态代码并不表示资源是暂时丢失还是永久丢失。但是如果一个资源被永久删除,理想情况下应该使用(Gone)而不是404状态
继续前进,同时检查
https://www.hyatt.com/
据观察,一些
和
标签指的是akam:
奥特罗 您可以在以下内容中找到一些更相关的讨论:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
options = webdriver.ChromeOptions()
options.add_argument("start-maximized")
# options.add_argument('disable-infobars')
driver = webdriver.Chrome(chrome_options=options, executable_path=r'C:\WebDrivers\chromedriver.exe')
driver.get("https://www.hyatt.com")
WebDriverWait(driver, 20).until(EC.title_contains("Hyatt"))
print(driver.title)
driver.quit()
最后我遇到了同样的问题。我甚至无法加载网页。但当我检查控制台时,其中的错误清楚地表明:
加载资源失败:服务器响应状态为404()
快照:
404找不到 客户端错误响应代码表示服务器找不到请求的资源。指向404页面的链接通常被称为断开或死链接,并且可能会受到攻击 404状态代码并不表示资源是暂时丢失还是永久丢失。但是如果一个资源被永久删除,理想情况下应该使用(Gone)而不是404状态
继续前进,同时检查
https://www.hyatt.com/
据观察,一些
和
标签指的是akam:
奥特罗 您可以在以下内容中找到一些更相关的讨论:
driver.get()之前打开开发人员工具。
。确保已打开录制(默认为)。这是我得到的网络信息:嘿,谢谢你深入了解这一点,看起来我们不能绕过网站安全。我会等着看是否有人能解决这个问题。错误404可能是错误429的结果。控制台只提供开发人员决定打印的内容。网络选项卡提供完整的跟踪。看到了吗他对站点的请求返回了429条。正如问题的评论中所提供的,这个错误已经有了一个线程@NicLaforge令人惊讶的是,网络选项卡没有注册任何条目:(@DebanjanB它有条目,但是你需要在调用driver.get()
之前打开开发者工具。确保记录已打开(默认设置为).这是我得到的网络信息:嘿,谢谢你深入研究,看起来我们不能绕过网站安全。我会等着看是否有人能解决这个问题。