Java 将组合的阿拉伯语字符拆分为单个字符
我正在尝试转换“组合阿拉伯字符”(如ﻼ ) 在组成“组合”字符的不同单个字符中(例如。ﻝ 在JAVA或C语言中,我无法做到这一点,因为我需要拆分完整的字符列表 在C#中,我试图获取Unicode字符,将其转换为Windows-1256,等待获取单个字符和组合字符使用的2到3字节,但我无法做到这一点Java 将组合的阿拉伯语字符拆分为单个字符,java,c#,arabic,Java,C#,Arabic,我正在尝试转换“组合阿拉伯字符”(如ﻼ ) 在组成“组合”字符的不同单个字符中(例如。ﻝ 在JAVA或C语言中,我无法做到这一点,因为我需要拆分完整的字符列表 在C#中,我试图获取Unicode字符,将其转换为Windows-1256,等待获取单个字符和组合字符使用的2到3字节,但我无法做到这一点 String unicodeWord = (char)sc; byte[] arabicBytes = System.Text.Encoding.GetEncoding(1256).GetBytes(
String unicodeWord = (char)sc;
byte[] arabicBytes = System.Text.Encoding.GetEncoding(1256).GetBytes(unicodeWord);
但结果总是
你能帮我吗?我使用java或c都没有问题
非常感谢
string input = "ﻼ";
string normalized = input.Normalize(NormalizationForm.FormKC);
请注意,有不同的结果;
FormKC
结果在ل和ا中重要注意:这里您不在字节之后;您在字符之后-因此这不是编码问题,而是规范化问题。