使用HTMLunit获取ajax/javascript内容
我已经编写了一个代码,它将获取页面的html内容作为响应,我正在使用html单元来实现这一点。但是我得到了一些特定URL的错误,比如 [https://communities.netapp.com/welcome][1] 对于第一页,我能够检索内容。但当我不知道的内容,我们得到使用加载更多的按钮 这是我的密码:使用HTMLunit获取ajax/javascript内容,java,javascript,ajax,parsing,htmlunit,Java,Javascript,Ajax,Parsing,Htmlunit,我已经编写了一个代码,它将获取页面的html内容作为响应,我正在使用html单元来实现这一点。但是我得到了一些特定URL的错误,比如 [https://communities.netapp.com/welcome][1] 对于第一页,我能够检索内容。但当我不知道的内容,我们得到使用加载更多的按钮 这是我的密码: import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import jav
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.io.Writer;
import java.net.MalformedURLException;
import com.gargoylesoftware.htmlunit.BrowserVersion;
import com.gargoylesoftware.htmlunit.FailingHttpStatusCodeException;
import com.gargoylesoftware.htmlunit.NicelyResynchronizingAjaxController;
import com.gargoylesoftware.htmlunit.WebClient;
import com.gargoylesoftware.htmlunit.html.HtmlPage;
public class Sample {
public static void main(String[] args) throws FailingHttpStatusCodeException, MalformedURLException, IOException, InterruptedException {
String url = "https://communities.netapp.com/welcome";
WebClient client = new WebClient(BrowserVersion.INTERNET_EXPLORER_9);
client.getOptions().setJavaScriptEnabled(true);
client.getOptions().setRedirectEnabled(true);
client.getOptions().setThrowExceptionOnScriptError(true);
client.getOptions().setCssEnabled(true);
client.getOptions().setUseInsecureSSL(true);
client.getOptions().setThrowExceptionOnFailingStatusCode(false);
client.setAjaxController(new NicelyResynchronizingAjaxController());
HtmlPage page = client.getPage(url);
Writer output = null;
String text = page.asText();
File file = new File("D://write6.txt");
output = new BufferedWriter(new FileWriter(file));
output.write(text);
output.close();
System.out.println("Your file has been written");
// System.out.println("as Text ==" +page.asText());
// System.out.println("asXML == " +page.asXml());
// System.out.println("text content ==" +page.getTextContent());
// System.out.println(page.getWebResponse().getContentAsString());
}
}
有什么建议吗?我从你的问题中了解到,你有一个按钮需要按下 请看: 这里有一个提交表单的示例 这里应该非常相似