java中XML解析的最佳方法
我正在使用stax解析包含HTML和java中的自定义标记的XML XML如下所示java中XML解析的最佳方法,java,xml-parsing,jackson,Java,Xml Parsing,Jackson,我正在使用stax解析包含HTML和java中的自定义标记的XML XML如下所示 <html><div>Hello World</div><div><br /></div> <div><br /> <Resource type="audio/m4a" height="72.00" id="lh6rde3c1d39148804cea99b054f4cc4bb990" width="72.00"
<html><div>Hello World</div><div><br /></div>
<div><br />
<Resource type="audio/m4a" height="72.00" id="lh6rde3c1d39148804cea99b054f4cc4bb990" width="72.00" />
<br /><br /></div>
<div><br />
</div><div>asfasdfasdfasdf</div><div><br /></div><div><br /></div><div><b>asdfasdfasdfasdf</b></div>
<div>
<b>adsfasdfasdf</b>
</div><div><b><br /></b></div><div><b><i>sdfasdfasdfas</i></b></div><div><i><b>asdfasdfasdfasdf</b>asdfasdfasdfasdf</i>
</div>
<Resource type="video/mp4" height="72.00" id="lh6rde3c1d39148804cesdfd2454f4cc4bb990" width="72.00" />
<div><i>asdfasdfasdfasdfasdf</i></div>
<div><ol><li><i>one</i></li><li><i>wto</i></li><li><i>three</i></li></ol><div>
<i>
asdfasdfasdfasdf</i>
</div><div>
<ul><li><i>one </i></li><li><i>thwo</i></li><li><i>three</i></li></ul></div>
</div></html>
Hello World
asfasdfasdfasdfasdf
asdfasdfasdfasdfasdfasdf
adsfasdfasdf
sdfasdfasdfassdfasdfasdfasdfasdfasdfasdfasdfasdfasdfasdfasdfasdfasdf
asdfasdfasdfasdfasdfasdfasdf
一个 世贸组织 三个
asdfasdfasdfasdfasdf
- 一个
三个- 三个
我只需要资源详细信息(即属性)
在解析速度方面还有其他更好的选择吗 这个问题太宽泛了,所以我不得不投反对票。我不知道XML解释的环境是什么,所以这个答案是有限的 然而,我可以告诉你,古典主义已经被使用;它们并不严格要求DTD,通过一些巧妙的枚举,您几乎可以解析任何东西 如Rafael Cardoso所述,它通常是一个HTML解析器,而不是HTML-in-XML解析器;但它可能对你有用。如果您要查找的只是特定标记的属性,以及(大概)相关数据,那么JDK可能已经具备了您所需要的所有功能 我们还有JDOM、DOM4J和其他一些组件,它们都有各自的优缺点。因此,这个问题不是特别有建设性,基本上是重复的;你可以看看 我建议你看看;这说明了如何使用标准库构建解析器 将来,如果可能,请指定您的程序运行的条件,向我们提供一个客观且明确定义的问题,并首先更彻底地研究堆栈溢出。尽管如此,我希望这能帮到你。祝你好运 使用作为HTML/XML解析器的Jsoup(一个库)