Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/81.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
用Java解析HTML?_Java_Html - Fatal编程技术网

用Java解析HTML?

用Java解析HTML?,java,html,Java,Html,我想解析HTML文件,原因如下: 以获取标记之间的内容。例如,在一对para标记之间 查找打断标记的出现次数的步骤 获取标记的属性。例如,要获取FONT COLOR=“red”> 我需要用Java来做这个。我知道Jehrico解析器的基础知识。我该怎么做呢?如果要解析的HTML是XHTML,那么它也应该是有效的XML。 因此,任何XML解析器都应该能够解析它 如果你不能依赖于此,你可以在谷歌上搜索Java的HTML解析器。现有的Java HTML解析器数量如下: 您可能还想对使用每种

我想解析HTML文件,原因如下:

  • 以获取标记之间的内容。例如,在一对para标记之间
  • 查找打断标记的出现次数的步骤
  • 获取标记的属性。例如,要获取FONT COLOR=“red”>

  • 我需要用Java来做这个。我知道Jehrico解析器的基础知识。我该怎么做呢?

    如果要解析的HTML是XHTML,那么它也应该是有效的XML。 因此,任何XML解析器都应该能够解析它


    如果你不能依赖于此,你可以在谷歌上搜索Java的HTML解析器。

    现有的Java HTML解析器数量如下:


    您可能还想对使用每种方法的利弊进行非常全面的讨论。

    您的实际问题是什么?我想可能是格式错误。你现在明白这个问题了吗?我以前使用过jsoup,发现它非常适合我需要做的事情。HTML可以在java中动态转换为XHTML吗?我认为JTidy应该能够完成这项工作。