Encoding 我们需要多少字节来存储一个阿拉伯字符
对于表示阿拉伯字符所需的存储空间,我有点困惑 如果这是真的,请告诉我:Encoding 我们需要多少字节来存储一个阿拉伯字符,encoding,arabic,Encoding,Arabic,对于表示阿拉伯字符所需的存储空间,我有点困惑 如果这是真的,请告诉我: 在ISO/IEC 8859-6编码中,需要2个字节(http://en.wikipedia.org/wiki/ISO/IEC_8859-6) 在UNICODE中,它需要4个字节(http://en.wikipedia.org/wiki/Arabic_Unicode) 每种编码的优点是什么?什么时候我们应该选择一种而不是另一种?有几种不同的unicode编码,使用的空间大小取决于您使用的编码:首先,unicode不是一种编
- 在ISO/IEC 8859-6编码中,需要2个字节(http://en.wikipedia.org/wiki/ISO/IEC_8859-6)
- 在UNICODE中,它需要4个字节(http://en.wikipedia.org/wiki/Arabic_Unicode)
每种编码的优点是什么?什么时候我们应该选择一种而不是另一种?有几种不同的unicode编码,使用的空间大小取决于您使用的编码:首先,unicode不是一种编码。它是为每种语言中的每个字符指定代码点的标准。这些代码点是整数;它们占用多少字节取决于特定的编码。最常见的Unicode编码是UTF-8和UTF-16 总结如下:
- ISO 8859-6对每个阿拉伯字符使用1个字节,但不支持“阿拉伯表示形式”,也不支持ASCII以外的任何其他脚本中的字符
- UTF-8对每个阿拉伯字符使用2个字节,“阿拉伯表示形式”使用3个字节
- UTF-16对每个阿拉伯字符使用2个字节,包括“阿拉伯表示形式”
总之,我通常会推荐UTF-8,因为它是明确的,并且非常支持ASCII文本。阿拉伯字符在两种编码中都是2字节(除非使用“表示形式”)。如果您只使用ASCII和阿拉伯语字符,而不使用其他字符,则可以使用ISO 8859-6,这将节省一些空间,但通常不值得,因为一旦出现其他字符,它就会中断。UTF-8和UTF-16支持Unicode中的所有字符。只要您始终指定使用哪一个字符,这两个字符都可以。必读:新文本中不应使用表示形式,渲染引擎应注意显示适当的位置形状。这个答案很好。谢谢