Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/71.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/sql-server-2005/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 如何使用需要正确HTML的库处理来自web的无效HTML文档_Java_Html_Itext_Saxparser - Fatal编程技术网

Java 如何使用需要正确HTML的库处理来自web的无效HTML文档

Java 如何使用需要正确HTML的库处理来自web的无效HTML文档,java,html,itext,saxparser,Java,Html,Itext,Saxparser,我在解析网站时遇到此错误。 错误:“实体“ContentType”的声明必须以“>”结尾。” 或者输入类型必须b关闭您考虑过吗 JTidy是HTML的Java端口Tidy、HTML语法检查器和pretty 打印机与它的非Java同类产品一样,JTidy可以用作 清理格式错误和错误的HTML。此外,JTidy还提供了 真实世界HTML的DOM解析器 显然,在某个时候,它会根据HTML的格式有多糟糕而与之斗争,但您可能会发现这对您很有用。1:修复输入,2修复库,以便它可以处理不正确的HTML,它可以

我在解析网站时遇到此错误。 错误:“实体“ContentType”的声明必须以“>”结尾。” 或者输入类型必须b关闭

您考虑过吗

JTidy是HTML的Java端口Tidy、HTML语法检查器和pretty 打印机与它的非Java同类产品一样,JTidy可以用作 清理格式错误和错误的HTML。此外,JTidy还提供了 真实世界HTML的DOM解析器


显然,在某个时候,它会根据HTML的格式有多糟糕而与之斗争,但您可能会发现这对您很有用。

1:修复输入,2修复库,以便它可以处理不正确的HTML,它可以处理brocken HTML。