Java 如何配置nekohtml解析器以正确关闭锚标记?
我正在使用nekohtml解析器解析我的html代码。有时我的错误,而使用锚标签的内容已经这样写Java 如何配置nekohtml解析器以正确关闭锚标记?,java,html,html-parsing,neko,Java,Html,Html Parsing,Neko,我正在使用nekohtml解析器解析我的html代码。有时我的错误,而使用锚标签的内容已经这样写 在通过nekohtml解析之后,我希望内容能像这样更正 为此,请帮助配置nekohtml解析 更新: 在我尝试将设置作为 解析器.setFeature(“http://cyberneko.org/html/features/balance-tags“,对) 这是没有用的。我没有给出我期望的结果。它返回与我给定的相同的html内容需要设置一个平衡标记功能,该功能指定NekoHTML解析器是否应尝试
在通过nekohtml解析之后,我希望内容能像这样更正
为此,请帮助配置nekohtml解析
更新:
在我尝试将设置作为
解析器.setFeature(“http://cyberneko.org/html/features/balance-tags“,对)
这是没有用的。我没有给出我期望的结果。它返回与我给定的相同的html内容需要设置一个
平衡标记
功能,该功能指定NekoHTML解析器是否应尝试平衡已解析文档中的标记
config.setFeature( "http://cyberneko.org/html/features/balance-tags", true );
从文档中:
- 通过添加缺少的父元素、使用可选的结束标记自动关闭元素以及纠正不平衡的内联元素标记,平衡标记修复了许多常见错误。为了将HTML文档作为XML处理,不应关闭此功能。此功能是为那些只关心特定元素、属性和/或内容外观的应用程序提供的性能增强功能,而不管文档的结构是否格式错误
片段上下文堆栈
可能就是您正在寻找的: