Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/324.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 停止Jsoup编码_Java_Jsoup - Fatal编程技术网

Java 停止Jsoup编码

Java 停止Jsoup编码,java,jsoup,Java,Jsoup,我正在尝试使用包含以下文本的JSoup来比较URL:Ætterni。 解析文档后,相同的字符串如下所示:Æ;tterni 如何防止这种情况发生?我要文件1:1,一模一样 代码: 你似乎没有以任何方式利用Jsoup的力量。我只需要使用简单的HTML流。这样,您就有了1:1的响应副本 InputStream input = new URL(url).openStream(); OutputStream output = new FileOutputStream(localLink); //

我正在尝试使用包含以下文本的JSoup来比较URL:
Ætterni
。 解析文档后,相同的字符串如下所示:
Æ;tterni

如何防止这种情况发生?我要文件1:1,一模一样

代码:


你似乎没有以任何方式利用Jsoup的力量。我只需要使用简单的HTML流。这样,您就有了1:1的响应副本

InputStream input = new URL(url).openStream();
OutputStream output = new FileOutputStream(localLink);
// Now copy input to output the usual Java IO way.
您不应使用
读卡器
/
写卡器
,因为这可能会使未知编码中的源字符格式不正确,因为将使用平台默认编码。

使用
doc.outputSettings().escapeMode(escapeMode.xhtml)

为了避免实体转换。

我将Jsoup用于存储网站的应用程序,所以我经常使用Jsoup的强大功能,但发布600 LoC:o这样的帖子是没有意义的。我只是简化了我的问题。所以我可以将OutputStreams与Josup一起使用,那么,您正在使用Jsoup遍历和操作HTML?你说过你想要一份1:1的复印件。我最初认为您使用Jsoup只是为了计算字符集,因为您错误地使用了
编写器
来保存内容。嗯,你不能阻止它编码特殊字符。当Jsoup这样做时,您到底遇到了什么问题?顺便说一句,Jsoup几乎从不通过
html()
返回1:1的副本,因为默认情况下,它会添加/清理一些标记,使其成为有效的html和格式良好的XML。是的,我正在完全重写html,以便可以用于本地文件系统。我遇到的问题是,它以一种不再被识别为URL的方式操纵特殊字符。例如,它将url/Mitglieder/Höttur.jpg更改为/Mitglieder/H&o u m l;ttur.jpg(添加空格)。我无法检索更改的url,因为它不再有效。据我所知,Jsoup不支持它。您可能希望在发布功能请求。编辑:对我来说,它为链接URL这么做似乎是一个错误。您希望这样报告。好的,谢谢您的时间和反馈。我将不得不编写一个自定义函数,然后返回到正常的网址。我也会报告。
InputStream input = new URL(url).openStream();
OutputStream output = new FileOutputStream(localLink);
// Now copy input to output the usual Java IO way.