Java JSOUP从属性中删除多次出现的单词
假设内容如下:Java JSOUP从属性中删除多次出现的单词,java,html,parsing,jsoup,Java,Html,Parsing,Jsoup,假设内容如下: 您的输入HTML的初始引号已转义。这意味着,alt标记的值不是男子,而是“男子”。在alt标记之后,基本上有多个布尔属性,即男子和,男子等 然后JSoup将删除重复的布尔属性,因为它们没有任何效果。您应该将HTML更改为正确的格式,而不使用转义引号 <p><img src="https://abcd.com/pic.jpg" alt="man with a umbrella on terrace with lots of xyz" width="500" he
您的输入HTML的初始引号已转义。这意味着,alt标记的值不是男子,而是“男子”
。在alt标记之后,基本上有多个布尔属性,即男子和,男子等
然后JSoup将删除重复的布尔属性,因为它们没有任何效果。您应该将HTML更改为正确的格式,而不使用转义引号
<p><img src="https://abcd.com/pic.jpg" alt="man with a umbrella on terrace with lots of xyz" width="500" height="400" /></p>
在本地和System.out中运行此操作将生成正确的
<html>
<head></head>
<body>
<p><img src="https://abcd.com/pic.jpg" alt="man with a umbrella on terrace with lots of xyz" width="500" height="400"></p>
</body>
</html>
您的输入HTML的初始引号已转义。这意味着,您的alt标记的值是“man
,而不是在有大量xyz的平台上撑着伞的人。在alt标记之后,基本上有多个布尔属性,分别是with
,a
,等等
然后JSoup将剥离重复的布尔属性,因为它们没有任何效果。您应该将HTML更改为正确的格式,不带转义引号
<p><img src="https://abcd.com/pic.jpg" alt="man with a umbrella on terrace with lots of xyz" width="500" height="400" /></p>
在本地和System.out中运行此操作将生成正确的
<html>
<head></head>
<body>
<p><img src="https://abcd.com/pic.jpg" alt="man with a umbrella on terrace with lots of xyz" width="500" height="400"></p>
</body>
</html>
原始内容是否为HTML?或者一个字符串
?也就是说,您是从HTML文件中读取的吗?原始内容是HTML吗?或者一个字符串
?也就是说,您正在从HTML文件中读取吗?谢谢您的帮助。HTML编辑器也验证了您的观点。我用StringEscapeUtils.escapeJava去掉了/“。谢谢你们的帮助。HTML编辑器也验证了你们的观点。我用StringEscapeUtils.escapeJava去掉了/”。