Java 使用“解析html”;未闭合标签“;在爪哇
我的问题很简单: 如果htmlcontent中有类似于此img标记的标记,有没有办法将java中的html解析为DOM文档Java 使用“解析html”;未闭合标签“;在爪哇,java,html,parsing,Java,Html,Parsing,我的问题很简单: 如果htmlcontent中有类似于此img标记的标记,有没有办法将java中的html解析为DOM文档 <p><img src="..."></p> 不能使用DocumentBuilder,因为它是XML解析器 但您需要一个HTML解析器,如: 我不这么认为,但我能做到。它不是domapi,但非常类似。HTML不是XML 除非您使用XHTML 因此,XML解析器没有理由解析您的HTML 使用HTML解析器,如。其中一个可能有帮助:
<p><img src="..."></p>
不能使用
DocumentBuilder
,因为它是XML解析器
但您需要一个HTML解析器,如:
- 我不这么认为,但我能做到。它不是domapi,但非常类似。HTML不是XML
除非您使用XHTML
因此,XML解析器没有理由解析您的HTML
使用HTML解析器,如。其中一个可能有帮助:
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
InputStream is = new ByteArrayInputStream( htmlcontent.getBytes());
Document dom = db.parse(is);
is.close();