Character encoding 这是什么字符编码?

Character encoding 这是什么字符编码?,character-encoding,Character Encoding,我需要清理一些包含法语文本的文件。问题是这些文件在同一个文件中错误地包含多个编码 我认为有些部分是ISO8859-1(拉丁语1),但其他部分的文本编码为单字节字符,看起来像“扩展”ASCII。换句话说,它是UTF-7编码加上以下内容: 0x82代表é(e急性) 0x8a代表è(e坟墓) 0x88表示ê(e扬抑) 0x85表示a(坟墓) 0x87表示ç(c cedilla) 这是什么编码?此网站显示了cedilla的0x87链接。除此之外,我没有看更多的内容,但我打赌您的其他信息也可以在这里找

我需要清理一些包含法语文本的文件。问题是这些文件在同一个文件中错误地包含多个编码

我认为有些部分是ISO8859-1(拉丁语1),但其他部分的文本编码为单字节字符,看起来像“扩展”ASCII。换句话说,它是UTF-7编码加上以下内容:

  • 0x82代表é(e急性)
  • 0x8a代表è(e坟墓)
  • 0x88表示ê(e扬抑)
  • 0x85表示a(坟墓)
  • 0x87表示ç(c cedilla)

这是什么编码?

此网站显示了cedilla的0x87链接。除此之外,我没有看更多的内容,但我打赌您的其他信息也可以在这里找到。

这是IBM PC的原始编码。

您也看过Windows-1252编码吗?(我去掉了utf-7标签;utf-7是完全不同的东西,不是ASCII的另一个名称。)这是大写字母C-cedilla,并且仅提到0x87作为UTF-8序列的第二个字节,这是巧合。是的。这几天看得不多了!