Character encoding 如何确定文件中的字符是否已损坏,或者只是使用不正确的编码查看

Character encoding 如何确定文件中的字符是否已损坏,或者只是使用不正确的编码查看,character-encoding,ascii,Character Encoding,Ascii,我正在处理的文件包含一些字符在打开时无法正确显示的文本 我被告知该文件采用UTF-8编码,但当我在sublime text 3中打开时(我甚至使用了在UTF-8中重新打开选项),有许多字符显示为?- 例如,Jiří被错误地显示为Jiř——因此ř没有正确显示,但长i是错误的。还有其他字符,例如čňř,也没有正确显示 经过一些调查,该文件似乎是ASCII编码(UTF-8的子集) 我已经检查了ASCII字符集,例如ř存在,因此我想知道问题是这些字符已经损坏,还是我使用的上述文件编码检查没有显示正确的文

我正在处理的文件包含一些字符在打开时无法正确显示的文本

我被告知该文件采用UTF-8编码,但当我在sublime text 3中打开时(我甚至使用了在UTF-8中重新打开选项),有许多字符显示为
- 例如,
Jiří
被错误地显示为
Jiř
——因此
ř
没有正确显示,但长i
是错误的。还有其他字符,例如
č
ň
ř
,也没有正确显示

经过一些调查,该文件似乎是ASCII编码(UTF-8的子集)

我已经检查了ASCII字符集,例如
ř
存在,因此我想知道问题是这些字符已经损坏,还是我使用的上述文件编码检查没有显示正确的文件编码

我尝试了一些到utf8的转换,但是没有一个能修复字符

 iconv -f ISO-8859-1 -t UTF-8 ~/my_location/my_file.txt > ~/my_location/my_file_f_ISO-8859-1.txt
 iconv -f CP1252 -t UTF-8 ~/my_location/my_file.txt > ~/my_location/my_file_f_CP1252.txt
 iconv -f Windows-1252 -t UTF-8 ~/my_location/my_file.txt > ~/my_location/my_file_f_Windows-1252.txt

如果有人对我如何继续调查有任何想法,我将不胜感激。

在十六进制编辑器中查看文件,查看字符所包含的实际字节,然后尝试找出任何可以使用这些字节对该字符进行编码的编码。非常感谢,显示为
的所有字符都具有相同的基本字节码,这意味着这些字符在文件中已损坏,而不是显示编码错误的文件的问题。顺便说一句,ASCII字符集中不包含-i和ř。实际上,使用ASCII编码编写文件是非常罕见的。我正在检查我找到的
i
(355),但再次查看我找不到
ř
,也许这就是它被转换为
 iconv -f ISO-8859-1 -t UTF-8 ~/my_location/my_file.txt > ~/my_location/my_file_f_ISO-8859-1.txt
 iconv -f CP1252 -t UTF-8 ~/my_location/my_file.txt > ~/my_location/my_file_f_CP1252.txt
 iconv -f Windows-1252 -t UTF-8 ~/my_location/my_file.txt > ~/my_location/my_file_f_Windows-1252.txt