Java 如何使用需要正确HTML的库处理来自web的无效HTML文档
我在解析网站时遇到此错误。 错误:“实体“ContentType”的声明必须以“>”结尾。” 或者输入类型必须b关闭您考虑过吗 JTidy是HTML的Java端口Tidy、HTML语法检查器和pretty 打印机与它的非Java同类产品一样,JTidy可以用作 清理格式错误和错误的HTML。此外,JTidy还提供了 真实世界HTML的DOM解析器Java 如何使用需要正确HTML的库处理来自web的无效HTML文档,java,html,itext,saxparser,Java,Html,Itext,Saxparser,我在解析网站时遇到此错误。 错误:“实体“ContentType”的声明必须以“>”结尾。” 或者输入类型必须b关闭您考虑过吗 JTidy是HTML的Java端口Tidy、HTML语法检查器和pretty 打印机与它的非Java同类产品一样,JTidy可以用作 清理格式错误和错误的HTML。此外,JTidy还提供了 真实世界HTML的DOM解析器 显然,在某个时候,它会根据HTML的格式有多糟糕而与之斗争,但您可能会发现这对您很有用。1:修复输入,2修复库,以便它可以处理不正确的HTML,它可以
显然,在某个时候,它会根据HTML的格式有多糟糕而与之斗争,但您可能会发现这对您很有用。1:修复输入,2修复库,以便它可以处理不正确的HTML,它可以处理brocken HTML。