Unicode 智能报价有哪些常见的错误编码方式?

Unicode 智能报价有哪些常见的错误编码方式?,unicode,encoding,Unicode,Encoding,智能引号在一种编码中保存,然后使用不同的编码进行渲染/查看时会导致问题。当呈现错误时,智能引号会以何种方式出现 我试图解决一个问题,当你看到一个错误的字符编码,然后可以说,“哦,这些应该是智能引号。”最常见的编码混淆可能是UTF-8与ANSI/Latin1 “''”的ANSI/Latin1编码是[93][91][92][94]十六进制。如果解释为UTF-8,这些字节很可能被视为无效字符,并可能显示为带方框的问号 “''”的UTF-8编码是[E2 80 9C][E2 80 98][E2 80 99

智能引号在一种编码中保存,然后使用不同的编码进行渲染/查看时会导致问题。当呈现错误时,智能引号会以何种方式出现


我试图解决一个问题,当你看到一个错误的字符编码,然后可以说,“哦,这些应该是智能引号。”

最常见的编码混淆可能是UTF-8与ANSI/Latin1

“''”的ANSI/Latin1编码是[93][91][92][94]十六进制。如果解释为UTF-8,这些字节很可能被视为无效字符,并可能显示为带方框的问号


“''”的UTF-8编码是[E2 80 9C][E2 80 98][E2 80 99][E2 80 9D]十六进制。如果解释为ANSI/Latin1,则这些字节将显示为€€€€€€€™ –欧元

为什么不试试看呢?使用智能引号创建字符串,并使用正确的编码保存。在假设编码不正确的情况下阅读。看看你得到了什么。你想怎么做就怎么做。你大错特错了。Latin-1是ISO 8859-1的法定别名。CP1252不是ISO 8859-1。不要相信微软的谎言。拉丁语1(ISO-8859-1)没有聪明的引语。通常,所有ISO-8859-*字符集为C1控制代码保留0x80-0x9F范围。Windows的CP1252不是一个法律标准,它只是ISO-8859-1的一个劣质版本,C1范围发生了变化,所以它是ANSI,正如“松散地基于ISO,其中ANSI是北美的代表,所有与现实的符合纯粹是偶然的”。