Java 哪个HTMLDOM解析器在Android上工作得最好?

Java 哪个HTMLDOM解析器在Android上工作得最好?,java,android,parsing,dom,screen-scraping,Java,Android,Parsing,Dom,Screen Scraping,我需要在Android应用程序中处理一些HTML页面,我更喜欢使用XPath来提取相关信息。对于常规J2SE,有许多可能的实现可以将常规HTML解析为: (列表可能不完整-已从中提取) 但是,要估计这些库在Android上是否工作以及工作得如何(库大小、cpu和内存消耗)是非常复杂的 根据您的经验-您选择的Android库是什么?好的,看起来没有人能回答这个问题-然后我必须亲自检查一下 jTidy 我下载了最新的jTidy源代码,对它们进行编译,并将创建的jar文件作为库添加到我的

我需要在Android应用程序中处理一些HTML页面,我更喜欢使用XPath来提取相关信息。对于常规J2SE,有许多可能的实现可以将常规HTML解析为:

(列表可能不完整-已从中提取)

但是,要估计这些库在Android上是否工作以及工作得如何(库大小、cpu和内存消耗)是非常复杂的


根据您的经验-您选择的Android库是什么?好的,看起来没有人能回答这个问题-然后我必须亲自检查一下

jTidy

我下载了最新的jTidy源代码,对它们进行编译,并将创建的jar文件作为库添加到我的Android应用程序中。在我的应用程序(模拟器和真实手机)中使用jTidy没有问题。在运行时,jTidy也可以很好地工作——但它似乎不适合有限的Android环境——它的工作速度非常慢。查看Logcat输出,甚至解析~10kb html文件都会导致垃圾收集器工作繁重

HTMLCleaner

根据我的经验,HTMLCleaner在Android上也很好;库大小相对较小(v2.2为106KB)。但是,它创建的解析DOM并不像预期的那样-HTMLCleaner会在DOM中插入额外的
元素。如果您想将其显示为HTML文件,这可能没问题,但对于我的用例(通过XPath表达式提取信息),这是不可能的

TagSoup

未经测试

耶利哥

未经测试

NekoHTML

未经测试

JSoup

未经测试