java中类似jquery的lib

java中类似jquery的lib,java,jquery,html,parsing,Java,Jquery,Html,Parsing,我正在寻找一个解析HTML的简单轻量级java库。我看了很多,有很多选择。但我找不到简单的东西。除了java之外,我真的希望在python中有类似pyquery的东西。我的要求是:快速、易用和轻便 我需要它做什么?不确定这是否重要,但我需要对html文档的部分进行索引。所以我希望能够快速选择文档的一部分,然后解析它 试试groovy。它有许多“slurper”,它们是用于读取XML、HTML以及JSON等标记的DSL。例如。用于将HTML规范化为xhtml,并解析生成的文档。没那么难 XPath

我正在寻找一个解析HTML的简单轻量级java库。我看了很多,有很多选择。但我找不到简单的东西。除了java之外,我真的希望在python中有类似pyquery的东西。我的要求是:快速、易用和轻便


我需要它做什么?不确定这是否重要,但我需要对html文档的部分进行索引。所以我希望能够快速选择文档的一部分,然后解析它

试试groovy。它有许多“slurper”,它们是用于读取XML、HTML以及JSON等标记的DSL。例如。

用于将HTML规范化为xhtml,并解析生成的文档。没那么难


XPath将提供类似于CSS选择器的简单选择。

我过去使用过HTMLPasser。我对它不是很满意。我找到了tagsoup和jsoup。我真的很喜欢。尚未广泛使用,但您可以执行以下操作:

Elements resultLinks = doc.select("h3 > a"); // direct a after h3

看看杰瑞,他看起来很有前途

Groovy是一种运行在JVM上的语言,基本上很容易包含在项目中。我看不出这被否决的原因。我对你的评论投了赞成票,Ben,但我想这家伙之所以被否决是因为groovy不是真正的java?到底什么是“真正的”java?它在JVM上运行,用Java编写,易于运行。@djondal。。谢谢是的,也许,但它仍然适用。无论哪种方式,在没有反馈的情况下投票否决都是站不住脚的。也许他们应该改变,所以我们不能在没有评论的情况下投票否决。在使用jsoup之后,我想这正是我想要的。我不明白为什么在谷歌搜索了这么多之后,它没有被找到。但它几乎具备了我需要的所有功能。看起来很相似。Tagsoup有一个java库,您也可以下载,但它不提供任何解析或查找功能;它只是生成了可以解析的好xml。