Java Jsoup connect(url)获取编码

Java Jsoup connect(url)获取编码,java,jsoup,Java,Jsoup,我在使用Jsoup连接URL时遇到一些问题,我无法设置HTML的编码,标记中的文本仅显示为“?”。我在论坛和文档中已经搜索得精疲力尽了,但我无法提出任何可行的解决方案 这是运行Jsoup connect时给我带来问题的HTML部分之一 运行连接时的结果如下: 如果我尝试使用解析器,我会收到以下消息:“请启用JavaScript以查看页面内容” 正如stackoverflow中的一些线程所述,我已经更改了输出编码,以检查问题是否存在,但结果是相同的。我试着将内容保存到一个正确的iso文件中,但

我在使用Jsoup连接URL时遇到一些问题,我无法设置HTML的编码,标记中的文本仅显示为“?”。我在论坛和文档中已经搜索得精疲力尽了,但我无法提出任何可行的解决方案

这是运行Jsoup connect时给我带来问题的HTML部分之一

运行连接时的结果如下:

如果我尝试使用解析器,我会收到以下消息:“请启用JavaScript以查看页面内容”

正如stackoverflow中的一些线程所述,我已经更改了输出编码,以检查问题是否存在,但结果是相同的。我试着将内容保存到一个正确的iso文件中,但效果不太好,同样的输出带有问号

我正在使用的代码片段非常简单,因为我只是尝试获取HTML:

Document doc = Jsoup.connect(a)
        .header("Content-Type", "application/x-www-form-urlencoded")
        .postDataCharset("ISO-8859-1") // tried other encodings but no success as well, same output
        .get();

System.out.println(doc);
在使用Jsoup中的connect().get()之前,是否有人遇到过此问题

更新 使用其他站点时,不会出现问题:

String a = "https://flatschart.com/html5/descricao.html";
        
Document doc = Jsoup.connect(a)
        .header("Content-Type", "application/x-www-form-urlencoded")
        .postDataCharset("ISO-8859-1")
        .get();
        
System.out.println(doc);

这是我对这个话题的一个回答。在对Java或JSoup的错误之处进行讨论之前,我想问一下您使用什么编辑器或浏览器来查看使用JSoup从网站下载的文件。Java可以通过自动方式轻松处理16位UNICODE。但是,如果您将下载的
字符串
保存到一个
'.html'文件
,并在浏览器中打开该
'.html'文件
,通常只有这样您才能看到可怕的代码�.关于第一个问题,我尝试了所有浏览器,iexplore、firefox和chrome,所有浏览器都在源代码中正确显示了文本。我做的另一个尝试是使用另一个具有相同特殊口音的站点,在那里我没有问题。我试着编辑了这篇文章。这一直是问题所在。我已经处理UTF-8外语字符4年了(在Java中)。Java“自动”完成UTF-8(再次)。两点。。。第1点:如果您在浏览器中查看页面,并且�' 显示-下次尝试将文件加载到一个简单的
记事本
,并查看是否正在渲染相应的字符。第2点:将其包含在
.html文件的
标题中(页面的
..
部分)<代码>