Encoding 字符编码问题

Encoding 字符编码问题,encoding,utf-8,Encoding,Utf 8,我正在使用一个API来处理我的文件并提供优化的输出,但一些特殊字符没有保留,例如: 输入:äöü 输出:ÃÃÃü 我该如何解决这个问题?我应该使用什么编码 非常感谢你的帮助 我不确定您使用的是哪种语言,但当输入内容的编码与读入内容的编码不匹配时,就会出现这种情况 因此,您可能希望确切地指定读取数据的编码。您可能需要使用实际需要的编码 string.getBytes("UTF-8") string.getBytes("UTF-16") string.getBytes("UTF-16LE") st

我正在使用一个API来处理我的文件并提供优化的输出,但一些特殊字符没有保留,例如:

输入:äöü

输出:ÃÃÃü

我该如何解决这个问题?我应该使用什么编码


非常感谢你的帮助

我不确定您使用的是哪种语言,但当输入内容的编码与读入内容的编码不匹配时,就会出现这种情况

因此,您可能希望确切地指定读取数据的编码。您可能需要使用实际需要的编码

string.getBytes("UTF-8")
string.getBytes("UTF-16")
string.getBytes("UTF-16LE")
string.getBytes("UTF-16BE") 
etc...

另外,对数据来源的系统进行一些研究。例如,来自ASP.NET的web服务以UTF-16LE的形式交付内容,而Java使用UTF-16BE编码。当这两个系统使用扩展字符相互通信时,它们可能无法完全以相同的方式相互理解。

这实际上取决于您对数据所做的处理。但一般来说,一种强大的技术是通过Iconv将其转换为UTF-8,并通过支持ASCII的API或函数传递。一般来说,如果这些函数不干扰它们不理解为ASCII的数据,那么UTF-8会被保留下来——这是UTF-8的一个很好的属性。

这不是编程问题吗?