Java 将无法识别的字符转换为正常格式

Java 将无法识别的字符转换为正常格式,java,utf-8,character,Java,Utf 8,Character,我的文件有一个错误。也就是说,所有字符都像“Giûi tÃnh”我想用Java编写一个程序,将这些字符转换成普通字符。我曾尝试将它们转换为字节,然后再次转换为字符串,但它保持不变 要做到这一点,您需要知道文件的编码。Java在内部将所有字符串表示为UTF-16;为了解决此问题,您需要知道文件的编码,并在读取文件时使用该编码:(Java API文档)您的文件不包含字符,而是包含字节。如果您看到您提到的字符,那么您已经为这些字节假定了特定的编码。不过,您没有与我们分享有关该计数的任何详细信息。如果

我的文件有一个错误。也就是说,所有字符都像
“Giûi tÃnh”
我想用Java编写一个程序,将这些字符转换成普通字符。我曾尝试将它们转换为字节,然后再次转换为字符串,但它保持不变

要做到这一点,您需要知道文件的编码。Java在内部将所有字符串表示为UTF-16;为了解决此问题,您需要知道文件的编码,并在读取文件时使用该编码:(Java API文档)

您的文件不包含字符,而是包含字节。如果您看到您提到的字符,那么您已经为这些字节假定了特定的编码。不过,您没有与我们分享有关该计数的任何详细信息。如果使用十六进制编辑器或转储,您会看到什么?e、 g.Unix
hextump-C文件名
或Windows
debug