Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/83.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 使用“解析html”;未闭合标签“;在爪哇_Java_Html_Parsing - Fatal编程技术网

Java 使用“解析html”;未闭合标签“;在爪哇

Java 使用“解析html”;未闭合标签“;在爪哇,java,html,parsing,Java,Html,Parsing,我的问题很简单: 如果htmlcontent中有类似于此img标记的标记,有没有办法将java中的html解析为DOM文档 <p><img src="..."></p> 不能使用DocumentBuilder,因为它是XML解析器 但您需要一个HTML解析器,如: 我不这么认为,但我能做到。它不是domapi,但非常类似。HTML不是XML 除非您使用XHTML 因此,XML解析器没有理由解析您的HTML 使用HTML解析器,如。其中一个可能有帮助:

我的问题很简单: 如果htmlcontent中有类似于此img标记的标记,有没有办法将java中的html解析为DOM文档

<p><img src="..."></p>

不能使用
DocumentBuilder
,因为它是XML解析器

但您需要一个HTML解析器,如:

    • 我不这么认为,但我能做到。它不是domapi,但非常类似。

      HTML不是XML

      除非您使用XHTML

      因此,XML解析器没有理由解析您的HTML

      使用HTML解析器,如。

      其中一个可能有帮助:


      请随意批准答案
      DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
      DocumentBuilder db = dbf.newDocumentBuilder();
      
      InputStream is = new ByteArrayInputStream( htmlcontent.getBytes());
      Document dom = db.parse(is);
      is.close();