Java 返回所有HtmlPage';s HTML
我想要给定HtmlPage对象的整个HTMLJava 返回所有HtmlPage';s HTML,java,htmlunit,Java,Htmlunit,我想要给定HtmlPage对象的整个HTML 我应该使用什么属性?实现这一点的最快方法是——它可能并不完美,例如,它可能与在普通浏览器中查看源代码时看到的不完全匹配,但我发现它对开发和调试HtmlUnit代码非常有帮助。实现这一点的最快方法是——它可能不完美,如,它可能与您在普通浏览器中“查看源代码”时看到的不完全匹配,但我发现它对开发和调试HtmlUnit代码非常有帮助;这意味着您可以使用获取返回的整个web响应来生成HtmlPage,并且从那里很容易()。这里有一个方法可以满足你的需要 pu
我应该使用什么属性?实现这一点的最快方法是——它可能并不完美,例如,它可能与在普通浏览器中查看源代码时看到的不完全匹配,但我发现它对开发和调试HtmlUnit代码非常有帮助。实现这一点的最快方法是——它可能不完美,如,它可能与您在普通浏览器中“查看源代码”时看到的不完全匹配,但我发现它对开发和调试HtmlUnit代码非常有帮助;这意味着您可以使用获取返回的整个web响应来生成
HtmlPage
,并且从那里很容易()。这里有一个方法可以满足你的需要
public String getRawPageText(WebClient client, String url)
throws FailingHttpStatusCodeException, MalformedURLException, IOException {
HtmlPage page = client.getPage(url);
return page.getWebResponse().getContentAsString();
}
或者,使用已获取的HtmlPage
对象:
public String getRawPageText(HtmlPage page) {
return page.getWebResponse().getContentAsString();
}
在HtmlUnit中,an实现接口;这意味着您可以使用获取返回的整个web响应来生成HtmlPage
,并且从那里很容易()。这里有一个方法可以满足你的需要
public String getRawPageText(WebClient client, String url)
throws FailingHttpStatusCodeException, MalformedURLException, IOException {
HtmlPage page = client.getPage(url);
return page.getWebResponse().getContentAsString();
}
或者,使用已获取的HtmlPage
对象:
public String getRawPageText(HtmlPage page) {
return page.getWebResponse().getContentAsString();
}
因为mrblah特别提到了一个HtmlPage对象,所以我只想将页面本身作为一个参数,而不是传递一个WebClient和一个URL。但是基本的想法是绝对正确的。完全地——我刚刚添加了它。因为mrblah特别提到了一个HtmlPage对象,我只想将页面本身作为一个参数,而不是传递一个WebClient和一个URL。但是基本的想法是绝对正确的。完全地——我刚刚添加了。是的,这实际上重建了文档,因此在传输过程中不会得到HTML——这会使事情变得更好(如果你想要整洁的文档版本)或更难(如果你正在寻找原始的HTML)。是的,这实际上重建了文档,因此,当HTML在网络上传递时,您不会得到它——这会使事情变得更好(如果您想要整洁的文档版本)或更难(如果您正在寻找原始HTML)。