适用于HTML的Java最佳DOM API

适用于HTML的Java最佳DOM API,java,dom,jsoup,Java,Dom,Jsoup,当我需要使用HTML文档时,使用HttpURLConnection的代码检索HTML文档时,什么是好的DOM api for Java。我注意到,除了DOM解析器之外,它还可以进行一些http连接。有更好或更适合更复杂的http请求的方法吗?用两句话来说,我的答案是:(A)不要在应用程序设计中混合使用网络连接和DOM解析。(B) 和你一起去很好 更多详情如下: (A) 我可以不建议混合使用两种需求(1)DOM解析和(2)处理HTTP连接。当然,我不知道你手头的情况,但你可能最终会得到一个不清楚的

当我需要使用HTML文档时,使用
HttpURLConnection
的代码检索HTML文档时,什么是好的DOM api for Java。我注意到,除了DOM解析器之外,它还可以进行一些http连接。有更好或更适合更复杂的http请求的方法吗?

用两句话来说,我的答案是:(A)不要在应用程序设计中混合使用网络连接和DOM解析。(B) 和你一起去很好

更多详情如下:

(A) 我可以建议混合使用两种需求(1)DOM解析和(2)处理HTTP连接。当然,我不知道你手头的情况,但你可能最终会得到一个不清楚的设计,这将很难维护。例如,如果您曾经迁移到HTTPS,您可以依赖解析器来处理它

(B) 也就是说,如果您使用的是HTML文档,您可能会对不仅能够处理有效的XHTML,而且能够处理不完整的标记更感兴趣

关于stackoverflow还有其他相关问题(如or),这些问题归结为以下工具:

  • 清理HTML页面以符合XHTML
  • DOM解析
  • 两者的结合
最常用的工具似乎是

  • (SAX,而不是DOM)
  • (+Xerces)
这也是一个开源Java HTML解析器列表,以方便您使用

如果您仍然认为解析器应该处理URL连接,那么您可以详细说明“更复杂的http请求”的含义


用两句话来说,我的答案是:(A)不要在应用程序设计中混用网络连接和DOM解析。(B) 和你一起去很好

更多详情如下:

(A) 我可以建议混合使用两种需求(1)DOM解析和(2)处理HTTP连接。当然,我不知道你手头的情况,但你可能最终会得到一个不清楚的设计,这将很难维护。例如,如果您曾经迁移到HTTPS,您可以依赖解析器来处理它

(B) 也就是说,如果您使用的是HTML文档,您可能会对不仅能够处理有效的XHTML,而且能够处理不完整的标记更感兴趣

关于stackoverflow还有其他相关问题(如or),这些问题归结为以下工具:

  • 清理HTML页面以符合XHTML
  • DOM解析
  • 两者的结合
最常用的工具似乎是

  • (SAX,而不是DOM)
  • (+Xerces)
这也是一个开源Java HTML解析器列表,以方便您使用

如果您仍然认为解析器应该处理URL连接,那么您可以详细说明“更复杂的http请求”的含义


HTH

由于我们不知道您的需求,因此一般图书馆建议被视为O/T。Jsoup或
HttpURLConnection
是否有某些特定的东西不能满足您的需求?如果是,请详细说明,这将是一个有效的so问题。可以通过不同的方式满足需求。(date-time java api vs.Joda-time)我在征求关于最佳api的建议,因为我知道有更多的api,我希望在这个领域有经验的人可以在这里推荐一些东西,同时以简洁的方式听取赞成和反对意见。如果这种类型的问题是无效的,所以问题我可以关闭它,只要让我知道。在那之前,我不会费心重新编辑我的帖子。谢谢。由于我们不知道您的需求,一般图书馆建议都被认为是O/T。Jsoup或
HttpURLConnection
是否有某些特定的东西不能满足您的需求?如果是,请详细说明,这将是一个有效的so问题。可以通过不同的方式满足需求。(date-time java api vs.Joda-time)我在征求关于最佳api的建议,因为我知道有更多的api,我希望在这个领域有经验的人可以在这里推荐一些东西,同时以简洁的方式听取赞成和反对意见。如果这种类型的问题是无效的,所以问题我可以关闭它,只要让我知道。在那之前,我不会费心重新编辑我的帖子。谢谢。谢谢你的设计说明。当然,我会将html检索与实际解析分离。但是我不明白为什么我不能用相同的API实现应用程序的这两个模块。谢谢你的设计说明。当然,我会将html检索与实际解析分离。但是,我不明白为什么不能用相同的API实现应用程序的这两个模块。