如何从Java验证HTML?

如何从Java验证HTML?,java,html,html-parsing,html-validation,Java,Html,Html Parsing,Html Validation,从Java验证HTML的快速而简单的方法是什么?我正在寻找一个开源/PD类(或一组类),它描述了100多个HTML标记的各种属性,例如: 标签是可选的吗?空的?省略其结束标记是否合法 此标签可以包含哪些其他标签(如果有) 此标记的哪些属性是合法的,它们的类型是什么?(不需要,但很高兴拥有) 谢谢 编辑 我希望对HTML文档进行逐个标记的分析,因此我对文档作为一个整体是否有效不太感兴趣,而是对每种类型的标记的具体要求是什么。 我可以根据W3C规范对规则进行编码,但我想先看看哪些现成的解决方案可用

从Java验证HTML的快速而简单的方法是什么?我正在寻找一个开源/PD类(或一组类),它描述了100多个HTML标记的各种属性,例如:

  • 标签是可选的吗?空的?省略其结束标记是否合法
  • 此标签可以包含哪些其他标签(如果有)
  • 此标记的哪些属性是合法的,它们的类型是什么?(不需要,但很高兴拥有)
  • 谢谢

    编辑

    我希望对HTML文档进行逐个标记的分析,因此我对文档作为一个整体是否有效不太感兴趣,而是对每种类型的标记的具体要求是什么。
    我可以根据W3C规范对规则进行编码,但我想先看看哪些现成的解决方案可用

    如果您想验证某些标记是否符合某些规范,那么基于Java的HTML解析器似乎无穷无尽:

    换句话说,您可以解析HTML,然后检查生成的文档中您正在查找的标记,并确定它们是否符合您需要的规范。如果他们不这样做,你可以抛出一个错误

    我不认为你会找到一个HTML分析工具,它完全是根据你的需求编写的,主要是因为这些需求没有被表达出来,可能有点模糊

    如果解析器没有做你想做的事情,至少这个列表是开源的,所以只要你发布你的更改,你就可以破解解析器。

    检查JTidy()和VietSpider HTMLParser()都是Java HTML解析器和一些语法检查功能。一些基于eclipse的HTML编辑器插件使用JTidy(或Tidy端口)进行语法检查。或者,将页面提交到w3c.org