用Java解析HTML?
我想解析HTML文件,原因如下:用Java解析HTML?,java,html,Java,Html,我想解析HTML文件,原因如下: 以获取标记之间的内容。例如,在一对para标记之间 查找打断标记的出现次数的步骤 获取标记的属性。例如,要获取FONT COLOR=“red”> 我需要用Java来做这个。我知道Jehrico解析器的基础知识。我该怎么做呢?如果要解析的HTML是XHTML,那么它也应该是有效的XML。 因此,任何XML解析器都应该能够解析它 如果你不能依赖于此,你可以在谷歌上搜索Java的HTML解析器。现有的Java HTML解析器数量如下: 您可能还想对使用每种
我需要用Java来做这个。我知道Jehrico解析器的基础知识。我该怎么做呢?如果要解析的HTML是XHTML,那么它也应该是有效的XML。 因此,任何XML解析器都应该能够解析它
如果你不能依赖于此,你可以在谷歌上搜索Java的HTML解析器。现有的Java HTML解析器数量如下:
您可能还想对使用每种方法的利弊进行非常全面的讨论。您的实际问题是什么?我想可能是格式错误。你现在明白这个问题了吗?我以前使用过jsoup,发现它非常适合我需要做的事情。HTML可以在java中动态转换为XHTML吗?我认为JTidy应该能够完成这项工作。