Html Jsoup分析错误(标记p中的标记表)

Html Jsoup分析错误(标记p中的标记表),html,jsoup,Html,Jsoup,当我使用Jsoup解析此代码时: <p> <table>[...]</table> </p> [...] Jsoup返回: <p></p> <table>[...]</table> [...] 这是个错误吗?我如何解决这个问题?我认为这与您的示例不是“有效”的html有关。我相信一个表不能存在于一个p标签中。Jsoup可能正在强制执行正确的HTML。Jsoup非常智能。如果您使用默认的解

当我使用Jsoup解析此代码时:

<p>
<table>[...]</table>
</p>

[...]

Jsoup返回:

<p></p>
<table>[...]</table>

[...]

这是个错误吗?我如何解决这个问题?

我认为这与您的示例不是“有效”的html有关。我相信一个表不能存在于一个p标签中。Jsoup可能正在强制执行正确的HTML。

Jsoup非常智能。如果您使用默认的解析方法,它会将您的输入文本转换为有效的html内容。

documentdoc=Jsoup.parse(html)

实际上,jsoup可以处理类似xml的文本(当然,包括html和xml)。您可以尝试使用以下方法来解析类似xml的文本。它不会改革您的输入,并按原样解析输入


Document doc=Jsoup.parse(html,“,Parser.xmlParser())

如果我用默认标记替换p标记,然后用jsoup解析代码……效果很好。这并不能回答OP关于jsoup返回是否错误的问题。@Verdamelt,是,它可能会从Jsoup返回无效的html代码,但提问者可能想找到一种方法来避免智能Jsoup的检查和重组过程。