Unicode在软件中的使用
长期以来,关于Unicode使用的问题一直困扰着我。Unicode允许加速和简化软件开发(就全球化而言),但我担心以下因素:Unicode在软件中的使用,unicode,Unicode,长期以来,关于Unicode使用的问题一直困扰着我。Unicode允许加速和简化软件开发(就全球化而言),但我担心以下因素: 增加内存和磁盘空间的使用 文本处理性能的降低 亚洲语言一视同仁,损害了各国的特殊性 第一段很明显。。。但我不知道其他的是真是假。是否有人面临着为亚洲国家本地化软件的需要,并愿意分享经验 目前,我尝试使用窄剖面的编码(cp1251-俄罗斯,cp1254-土耳其,等等)。有人能就这个问题提出建议吗?前两点可以忽略不计。您需要有一个非常具体的用例,其中大小和性能的差异会产生明显
目前,我尝试使用窄剖面的编码(cp1251-俄罗斯,cp1254-土耳其,等等)。有人能就这个问题提出建议吗?前两点可以忽略不计。您需要有一个非常具体的用例,其中大小和性能的差异会产生明显的差异,从而证明混合编码的头痛是合理的 关于Unihan字符:它们根据字符的含义进行分组,但在不同的书写系统中,该字符的书写可能略有不同。这是正确标记语言的问题,实际上不是编码问题。在HTML文档中,您可以使用
lang
属性标记文档和/或使用CSS设置特定字体,这将适当改变语言字符的外观。如何正确处理此问题取决于软件的类型(HTML、桌面应用程序等)。我建议你就此提出一个新的、详细的问题
看看这位官员。关于这些问题,它有很多话要说。增加了文本大小,而以下所有内容实际上都是不真实的 对于旧式的unicode编码,例如UTF-16,它们可能是正确的。UTF-8不比ASCII更大,也不比ASCII慢,但它允许对每个Unicode码点进行编码。UTF-8也是当今市场上使用Unicode的事实标准
对不同的Unicode编码的性能进行了广泛的分析,包括亚洲语言。你真的认为“增加的文本大小”是一个真正的问题吗?o、 我不清楚你所说的第三点是什么意思——你的第一点在记忆中是什么意思?(如果你和大多数人谈论文本大小,他们会认为你谈论的是屏幕上字形的大小…)最后一个很大程度上取决于细节和你正在开发的软件类型。如果可用,请提供更多上下文。所有代码页最终都映射到Unicode,因此不清楚您的替代方案是什么。内存使用没有增加。使用UTF8。感谢您对“郎”的建议。。。我只是看了一下,发现Unihan字符并没有我想象的那么大问题。
lang
属性对渲染的影响很小(尽管它的影响可能会增加)。它可能会影响默认字体的选择,从而使CJK字符以中文或日文字体显示。但网页大多都有自己的字体设置,默认字体通常并不重要。UTF-8编码的字符形式最多有4个字节。关于6字节的信息已经过时(从将Unicode编码空间限制为0..10FFFF之前的时间段)。我认为使用Unicode更合理(但需要保留用户语言)。