Java JSoup转换后的文本转换不正确
我使用JSoup解析HTML。我有一个文本字符串:Java JSoup转换后的文本转换不正确,java,html,jsoup,Java,Html,Jsoup,我使用JSoup解析HTML。我有一个文本字符串: &ap 使用以下命令解析后: Jsoup.parseBodyFragment("&ap"); 它被转换为有线字符:≈ 该字符实际上来自URL: http://mycompany.com?param=1&app=100 请注意,URL的&ap部分始终替换为有线字符,因此URL变为: http://mycompany.com?param=1≈p=100 我认为这可能与HTML编码有关 有人能告诉我如何解决这个
&ap
使用以下命令解析后:
Jsoup.parseBodyFragment("&ap");
它被转换为有线字符:≈代码>
该字符实际上来自URL:
http://mycompany.com?param=1&app=100
请注意,URL的&ap
部分始终替换为有线字符,因此URL变为:
http://mycompany.com?param=1≈p=100
我认为这可能与HTML编码有关
有人能告诉我如何解决这个问题吗?你能提供更多信息如何重现这个问题吗?
我用以下代码进行了尝试:
public static void main(String[] args) throws MalformedURLException, IOException {
Document doc = Jsoup.parseBodyFragment("<a href=\"http://mycompany.com?param=1&app=100\" />\n<p>http://mycompany.com?param=1&app=100</p>");
System.out.println(doc.toString());
System.out.println();
System.out.println(doc.getElementsByAttribute("href"));
}
publicstaticvoidmain(字符串[]args)引发畸形的异常,IOException{
Document doc=Jsoup.parseBodyFragment(“
http://mycompany.com?param=1&;app=100
在那里,&
被翻译成了&
<html>
<head></head>
<body>
<a href="http://mycompany.com?param=1&app=100"></a>
<p>http://mycompany.com?param=1&app=100</p>
</body>
</html>
<a href="http://mycompany.com?param=1&app=100"></a>