Encoding 与此转换匹配的字符编码是什么:From“From”§&引用;至Ç&引用;?

Encoding 与此转换匹配的字符编码是什么:From“From”§&引用;至Ç&引用;?,encoding,special-characters,character,Encoding,Special Characters,Character,下面这行代码是我使用的许多字符编码错误的文件中的一个示例 REAPRESENTA§AO VIA DTENTRY 正确的演示应该是: REAPRESENTAÇAO VIA DTENTRY 有更多的字符编码错误。我如何纠正这个问题 文件本身没有错误的编码,只有在读取文件时才使用错误的编码对其进行解码 纠正方法是使用与编码文件相同的编码对其进行解码 如果您不知道这是什么编码,您应该在解码问题字符之前找出这些字符的字节码,并使用字符码与所需字符匹配的字符集查找编码 例如,可以使用IBM905对该文件

下面这行代码是我使用的许多字符编码错误的文件中的一个示例

REAPRESENTA§AO VIA DTENTRY
正确的演示应该是:

REAPRESENTAÇAO VIA DTENTRY
有更多的字符编码错误。我如何纠正这个问题


文件本身没有错误的编码,只有在读取文件时才使用错误的编码对其进行解码

纠正方法是使用与编码文件相同的编码对其进行解码

如果您不知道这是什么编码,您应该在解码问题字符之前找出这些字符的字节码,并使用字符码与所需字符匹配的字符集查找编码

例如,可以使用IBM905对该文件进行编码,以便将字符“ch”编码到字节码74中。如果随后使用IBM278对文件进行解码,字节码74将被解释为字符“§”

以下是我在内置编码中发现的可能组合列表:

from cp875 to IBM290
from cp875 to IBM420
from cp875 to x-EBCDIC-KoreanExtended
from cp875 to IBM-Thai
from cp875 to IBM880
from IBM290 to IBM290
from IBM290 to IBM420
from IBM290 to x-EBCDIC-KoreanExtended
from IBM290 to IBM-Thai
from IBM290 to IBM880
from IBM420 to IBM290
from IBM420 to IBM420
from IBM420 to x-EBCDIC-KoreanExtended
from IBM420 to IBM-Thai
from IBM420 to IBM880
from IBM424 to IBM290
from IBM424 to IBM420
from IBM424 to x-EBCDIC-KoreanExtended
from IBM424 to IBM-Thai
from IBM424 to IBM880
from x-EBCDIC-KoreanExtended to IBM290
from x-EBCDIC-KoreanExtended to IBM420
from x-EBCDIC-KoreanExtended to x-EBCDIC-KoreanExtended
from x-EBCDIC-KoreanExtended to IBM-Thai
from x-EBCDIC-KoreanExtended to IBM880
from IBM-Thai to IBM290
from IBM-Thai to IBM420
from IBM-Thai to x-EBCDIC-KoreanExtended
from IBM-Thai to IBM-Thai
from IBM-Thai to IBM880
from IBM880 to IBM290
from IBM880 to IBM420
from IBM880 to x-EBCDIC-KoreanExtended
from IBM880 to IBM-Thai
from IBM880 to IBM880
from cp1025 to IBM290
from cp1025 to IBM420
from cp1025 to x-EBCDIC-KoreanExtended
from cp1025 to IBM-Thai
from cp1025 to IBM880
from IBM1026 to IBM01143
from IBM1026 to IBM278
from IBM905 to IBM01143
from IBM905 to IBM278

文件本身没有错误的编码,只有在读取文件时才使用错误的编码对其进行解码

纠正方法是使用与编码文件相同的编码对其进行解码

如果您不知道这是什么编码,您应该在解码问题字符之前找出这些字符的字节码,并使用字符码与所需字符匹配的字符集查找编码

例如,可以使用IBM905对该文件进行编码,以便将字符“ch”编码到字节码74中。如果随后使用IBM278对文件进行解码,字节码74将被解释为字符“§”

以下是我在内置编码中发现的可能组合列表:

from cp875 to IBM290
from cp875 to IBM420
from cp875 to x-EBCDIC-KoreanExtended
from cp875 to IBM-Thai
from cp875 to IBM880
from IBM290 to IBM290
from IBM290 to IBM420
from IBM290 to x-EBCDIC-KoreanExtended
from IBM290 to IBM-Thai
from IBM290 to IBM880
from IBM420 to IBM290
from IBM420 to IBM420
from IBM420 to x-EBCDIC-KoreanExtended
from IBM420 to IBM-Thai
from IBM420 to IBM880
from IBM424 to IBM290
from IBM424 to IBM420
from IBM424 to x-EBCDIC-KoreanExtended
from IBM424 to IBM-Thai
from IBM424 to IBM880
from x-EBCDIC-KoreanExtended to IBM290
from x-EBCDIC-KoreanExtended to IBM420
from x-EBCDIC-KoreanExtended to x-EBCDIC-KoreanExtended
from x-EBCDIC-KoreanExtended to IBM-Thai
from x-EBCDIC-KoreanExtended to IBM880
from IBM-Thai to IBM290
from IBM-Thai to IBM420
from IBM-Thai to x-EBCDIC-KoreanExtended
from IBM-Thai to IBM-Thai
from IBM-Thai to IBM880
from IBM880 to IBM290
from IBM880 to IBM420
from IBM880 to x-EBCDIC-KoreanExtended
from IBM880 to IBM-Thai
from IBM880 to IBM880
from cp1025 to IBM290
from cp1025 to IBM420
from cp1025 to x-EBCDIC-KoreanExtended
from cp1025 to IBM-Thai
from cp1025 to IBM880
from IBM1026 to IBM01143
from IBM1026 to IBM278
from IBM905 to IBM01143
from IBM905 to IBM278

你确定你使用的字体不是原因吗?不是。这是一个与utf-8兼容的纯文本文件!你确定你使用的字体不是原因吗?不是。这是一个与utf-8兼容的纯文本文件@Guffa:我想这就是问题所在(即您上一段描述的过程),使用SO的Mechanical Turk实现。@Guffa,看看那个图像是否有助于识别编码。@Guffa,您知道是否可以使用PHP进行此转换吗?@Acacio:从图像中,我可以看出字符编码为两个字节C2 A7。我还没有发现任何内置的编码可以将其解码为字符“玟”。似乎文件的内容曾经使用错误的编码进行解码,然后使用UTF-8保存,因此原始信息永远丢失。您所能做的最好是尝试反向执行错误的转换,并希望获得尽可能多的信息。@Acacio:我不知道PHP有什么编码和解码功能,所以我不知道用PHP进行恢复是否容易。@Guffa:我想这就是问题所在(即您上一段描述的过程),使用SO的Mechanical Turk实现。@Guffa,看看该图像是否有助于识别编码。@Guffa,你知道是否可以使用PHP进行此转换吗?@Acacio:从图像中,我可以看出字符编码为两个字节C2 A7。我还没有发现任何内置的编码可以将其解码为字符“玟”。似乎文件的内容曾经使用错误的编码进行解码,然后使用UTF-8保存,因此原始信息永远丢失。您所能做的最好是尝试反向执行错误的转换,并希望获得尽可能多的信息。@Acacio:我不知道PHP在编码和解码方面有什么功能,所以我不知道在PHP中尝试恢复是否容易。