org.openqa.selenium.WebDriver.getpageSource返回不带引号的html文档

org.openqa.selenium.WebDriver.getpageSource返回不带引号的html文档,selenium,selenium-webdriver,Selenium,Selenium Webdriver,我正在尝试使用Selenium类WebDriver检索网页的HTML源代码。但是函数getPageSource()返回的HTML文档中没有任何属性的引号。 因此,DOM解析器抛出org.xml.sax.SAXParseException:Open quote应该是属性exception. 有什么解决办法吗?我想你不应该把它用于这个目的。从: java.lang.String getPageSource() 获取上次加载页面的源。如果页面已被修改 加载(例如,通过Javascript)后,无法保

我正在尝试使用
Selenium类WebDriver
检索网页的HTML源代码。但是函数
getPageSource()
返回的HTML文档中没有任何属性的引号。

因此,DOM解析器抛出
org.xml.sax.SAXParseException:Open quote应该是属性
exception.


有什么解决办法吗?

我想你不应该把它用于这个目的。从:

java.lang.String getPageSource()

获取上次加载页面的源。如果页面已被修改 加载(例如,通过Javascript)后,无法保证 返回的文本是已修改页面的文本。请查阅 用于确定是否 返回的文本反映页面或文本的当前状态 上次由web服务器发送。返回的页面源是一个 底层DOM的表示:不要期望它被格式化 或以与从web服务器发送的响应相同的方式进行转义。 把它看作是艺术家的印象


无论如何,如果您确实需要使用WebDriver,并且当前浏览器无法正常工作,我建议您尝试另一个浏览器。我刚刚试过FireFoxDriver(driver v2.40),我在那里引用了我的话。

但我只需要在IE中执行测试用例。不允许有其他borwser