Java 如何在没有第三方库的情况下完整解析HTML?
我对这个问题感到困惑 我可以像下面这样解析HTMLJava 如何在没有第三方库的情况下完整解析HTML?,java,html,ajax,parsing,load,Java,Html,Ajax,Parsing,Load,我对这个问题感到困惑 我可以像下面这样解析HTML package org.owls.parser.html; import java.io.BufferedReader; import java.io.InputStreamReader; import java.net.HttpURLConnection; import java.net.URL; public class HTMLParser { public static String getHTTPStringsFromWe
package org.owls.parser.html;
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
public class HTMLParser {
public static String getHTTPStringsFromWeb(String urlStr) throws Exception {
StringBuffer sb = new StringBuffer();
URL url = new URL(urlStr);
HttpURLConnection con = (HttpURLConnection) url.openConnection();
BufferedReader br = null;
if(con.getResponseCode() == HttpURLConnection.HTTP_OK)
{
br = new BufferedReader(new InputStreamReader(con.getInputStream()));
String line = "";
while((line = br.readLine()) != null){
sb.append(line);
}
br.close();
}
return sb.toString();
}
}
这段代码运行良好,但存在一个问题。此代码无法获取由ajax结果生成的动态数据
所以我想得到完整的页面。可能吗
人们都在谈论jsoup,但我想知道的是,在native上是否有这样的功能
谢谢:D在您尝试执行的过程中存在一个固有的问题,您需要一个web浏览器/环境来执行ajax请求。将它们读入字符串并查找url是不够的,函数可能会对您无法支持的数据执行一些特殊的操作 您必须使用phantomjs之类的东西,它可以在无头环境中加载和解析页面