Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/370.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 返回所有HtmlPage';s HTML_Java_Htmlunit - Fatal编程技术网

Java 返回所有HtmlPage';s HTML

Java 返回所有HtmlPage';s HTML,java,htmlunit,Java,Htmlunit,我想要给定HtmlPage对象的整个HTML 我应该使用什么属性?实现这一点的最快方法是——它可能并不完美,例如,它可能与在普通浏览器中查看源代码时看到的不完全匹配,但我发现它对开发和调试HtmlUnit代码非常有帮助。实现这一点的最快方法是——它可能不完美,如,它可能与您在普通浏览器中“查看源代码”时看到的不完全匹配,但我发现它对开发和调试HtmlUnit代码非常有帮助;这意味着您可以使用获取返回的整个web响应来生成HtmlPage,并且从那里很容易()。这里有一个方法可以满足你的需要 pu

我想要给定HtmlPage对象的整个HTML


我应该使用什么属性?

实现这一点的最快方法是——它可能并不完美,例如,它可能与在普通浏览器中查看源代码时看到的不完全匹配,但我发现它对开发和调试HtmlUnit代码非常有帮助。

实现这一点的最快方法是——它可能不完美,如,它可能与您在普通浏览器中“查看源代码”时看到的不完全匹配,但我发现它对开发和调试HtmlUnit代码非常有帮助;这意味着您可以使用获取返回的整个web响应来生成
HtmlPage
,并且从那里很容易()。这里有一个方法可以满足你的需要

public String getRawPageText(WebClient client, String url)
        throws FailingHttpStatusCodeException, MalformedURLException, IOException {
    HtmlPage page = client.getPage(url);
    return page.getWebResponse().getContentAsString();
}
或者,使用已获取的
HtmlPage
对象:

public String getRawPageText(HtmlPage page) {
    return page.getWebResponse().getContentAsString();
}
在HtmlUnit中,an实现接口;这意味着您可以使用获取返回的整个web响应来生成
HtmlPage
,并且从那里很容易()。这里有一个方法可以满足你的需要

public String getRawPageText(WebClient client, String url)
        throws FailingHttpStatusCodeException, MalformedURLException, IOException {
    HtmlPage page = client.getPage(url);
    return page.getWebResponse().getContentAsString();
}
或者,使用已获取的
HtmlPage
对象:

public String getRawPageText(HtmlPage page) {
    return page.getWebResponse().getContentAsString();
}

因为mrblah特别提到了一个HtmlPage对象,所以我只想将页面本身作为一个参数,而不是传递一个WebClient和一个URL。但是基本的想法是绝对正确的。完全地——我刚刚添加了它。因为mrblah特别提到了一个HtmlPage对象,我只想将页面本身作为一个参数,而不是传递一个WebClient和一个URL。但是基本的想法是绝对正确的。完全地——我刚刚添加了。是的,这实际上重建了文档,因此在传输过程中不会得到HTML——这会使事情变得更好(如果你想要整洁的文档版本)或更难(如果你正在寻找原始的HTML)。是的,这实际上重建了文档,因此,当HTML在网络上传递时,您不会得到它——这会使事情变得更好(如果您想要整洁的文档版本)或更难(如果您正在寻找原始HTML)。