Java 将数据解析为DocumentHTML

Java 将数据解析为DocumentHTML,java,android,html,Java,Android,Html,当我使用InputStreamReader从网页读取数据时,一切都正常。 我无法将数据解析为DocumentHTML 主要原因是HTML脚本中有一些特殊字符使用不正确。 有两个&符号(&&),我相信这会导致代码崩溃 我的代码如下所示: URL url = new URL(PageUrl); URLConnection conn = url.openConnection(); // ... omitted ... // parsing HTMLDocument doc = (HTMLDocume

当我使用InputStreamReader从网页读取数据时,一切都正常。 我无法将数据解析为DocumentHTML

主要原因是HTML脚本中有一些特殊字符使用不正确。 有两个&符号(&&),我相信这会导致代码崩溃

我的代码如下所示:

URL url = new URL(PageUrl);
URLConnection conn = url.openConnection();
// ... omitted ...

// parsing
HTMLDocument doc = (HTMLDocument)db.parse(conn.getInputStream());
因为我正在制作一个Android应用程序,所以我不使用标准的解析函数,因为DocumentHTML对象太大了

我发现了许多解析HTML的现有示例,比如使用jsoup,但它们不是我想要的


我想编写自己的解析代码,以便HTMLDocument对象保持较小。

为什么不使用java中所有可用的Html解析器? 他们有社区支持,所以他们是最好的选择


主要原因是,如果我使用java中可用的Html解析器,HTMLDocument对象的大小将达到兆位,而且太大,因为android应用程序的运行速度会很慢。若我将编写自己的代码,HTMLDocument对象的大小将以千比特为单位,并且它的大小将适合支持android应用程序。它的工作速度会快得多。这里有一些应用程序内部编码解析器的示例。我希望有帮助:->