Python 如何在几秒钟后停止html加载?

Python 如何在几秒钟后停止html加载?,python,python-3.x,selenium,selenium-webdriver,Python,Python 3.x,Selenium,Selenium Webdriver,我有一大堆HTML要检查,每次我尝试用driver.get(“HTML”)加载它时,完成加载所需的时间太长。我的意思是,它已经在2秒钟内显示了我需要的东西,然后它继续加载东西大约10秒钟,我想 我想我已经找够了。以下是我尝试过的东西 设置页面加载超时 我曾经 驱动程序。设置页面加载超时(2) 尝试: 获取驱动程序(“HTML”) 除TimeoutException外: 通过 但是我发现,在它获得TimeOutException之后,它不会重新激活它,因此驱动程序无法加载第二个HTML并直接进入T

我有一大堆HTML要检查,每次我尝试用driver.get(“HTML”)加载它时,完成加载所需的时间太长。我的意思是,它已经在2秒钟内显示了我需要的东西,然后它继续加载东西大约10秒钟,我想

我想我已经找够了。以下是我尝试过的东西

  • 设置页面加载超时 我曾经

    驱动程序。设置页面加载超时(2)

    尝试: 获取驱动程序(“HTML”) 除TimeoutException外: 通过

  • 但是我发现,在它获得TimeOutException之后,它不会重新激活它,因此驱动程序无法加载第二个HTML并直接进入TimeOutException

  • 页面加载策略:
  • 事实上,这是可行的。但不幸的是,我使用了两个驱动程序。第一个驱动程序是收集HTML的驱动程序,第二个驱动程序是加载下载的HTML

    caps = DesiredCapabilities().CHROME
    caps["pageLoadStrategy"] = "none"
    normal = DesiredCapabilities().CHROME
    normal["pageLoadStrategy"] = "normal"
    
    driver2 = webdriver.Chrome("chromedriver78.exe", chrome_options=options2, desired_capabilities=caps)
    driver = webdriver.Chrome("chromedriver78.exe", chrome_options=options, desired_capabilities = normal)
    
    我发现的问题是,只应用了最后设置的一个“期望的功能”。这意味着,驱动程序和驱动程序2共享最后所需的_功能设置。。。所以,如果我稍后设置驱动程序,driver2没有什么区别,它只需加载HTML大约10秒钟。如果我稍后设置driver2,驱动程序的整个过程都会被破坏,因为它会在页面完全加载之前保持激活状态


    所以。。。这对我来说是更好的方式吗?希望能得到一些帮助。

    为什么要使用两个驱动程序?您只能创建一个驱动程序,并将
    pageLoadStrategy
    设置为
    “渴望”
    。在那之后,你可以从HTML中获取数据。@ManaliKagathara好吧,实际上第一个驱动程序将是无头的,在所有这些之后,我将使用PyInstaller使其成为exe文件。这将是一个简单的重复与一些决定,如果HTML是一个我想要的或不是一个巨大的工作。这就是为什么我认为只处理exe文件,然后单独检查HTML会更方便。我无法得到你的澄清。为什么要创建两个浏览器实例?描述你的问题。@ManaliKagathara好吧,工作是从人物搜索网站收集人物的HTML。所以我需要打开HTML,检查HTML是否有任何错误,以及我是否找到了合适的人。(事实上,我需要将它与其他网站进行比较,所以…还有第三个浏览器。)第一个浏览器显示具有特定姓名的人的列表,当我选择它时,它下载HTML,然后第二个浏览器显示HTML,第三个显示了我的交叉检查问题是,当我选择一个家伙并从我下载的HTML中读取它进行检查时,加载时间太长。