python:pyQT-QApplication-QwebPage实例来抓取javascript-如何彻底销毁和重新初始化

python:pyQT-QApplication-QwebPage实例来抓取javascript-如何彻底销毁和重新初始化,python,pyqt,initialization,instance,Python,Pyqt,Initialization,Instance,我正在使用Scrapy(python)来抓取运行时使用JavaScript生成的网页。有许多选项可以这样做,包括停靠的中间件,如Splash、Selenium等 然而,我决定通过运行一个PyQT实例(with.QWebPage())来解决这个问题,该实例有一个WebKit解释器,因此可以解析.js 考虑到要爬网的页面的规模,我想按顺序运行一些作业,并在它们之间完全重新初始化PyQT。然而,我似乎无法完全重新初始化PyQT 代码很复杂,但我从StackOverflower同事那里得到的这个简单、自

我正在使用Scrapy(python)来抓取运行时使用JavaScript生成的网页。有许多选项可以这样做,包括停靠的中间件,如Splash、Selenium等

然而,我决定通过运行一个PyQT实例(with.QWebPage())来解决这个问题,该实例有一个WebKit解释器,因此可以解析.js

考虑到要爬网的页面的规模,我想按顺序运行一些作业,并在它们之间完全重新初始化PyQT。然而,我似乎无法完全重新初始化PyQT

代码很复杂,但我从StackOverflower同事那里得到的这个简单、自包含的示例似乎也有同样的问题:;)

预期输出应为

!DOCTYPE html><html itemscope  google
!DOCTYPE html PUBLIC "-//W3C/  bing
!DOCTYPE html><html lang="mul wikipedia 
!DOCTYPE html>
!DOCTYPE html><html itemscope  google
!DOCTYPE html PUBLIC "-//W3C/  bing
!DOCTYPE html><html lang="mul wikipedia 
!DOCTYPE html><html itemscope  google
!DOCTYPE html PUBLIC "-//W3C/  bing
<html><head></head>< wikipedia (fails)