如何将ANSI文本转换为Unicode?

如何将ANSI文本转换为Unicode?,unicode,character,font-face,rtf,Unicode,Character,Font Face,Rtf,我想将RTF文本转换为Unicode。在RTF字体表中,可以找到字体或字体的名称,例如Arial Cyr、Courier希腊文和要使用的字符集0-255。那么,如何编写一个函数,将具有这些设置的字符代码0-255转换为Unicode 如我所见,希腊文、Cyr、Tur等post标记会影响显示字符的字形,字符集也会影响它。因此,函数可以具有以下输入参数: fontname后缀、字体字符集、字符代码 但下一步是什么?还是我走错了路?RTF早在Unicode发明之前就已经发明了。它肯定不是ANSI文本,

我想将RTF文本转换为Unicode。在RTF字体表中,可以找到字体或字体的名称,例如Arial Cyr、Courier希腊文和要使用的字符集0-255。那么,如何编写一个函数,将具有这些设置的字符代码0-255转换为Unicode

如我所见,希腊文、Cyr、Tur等post标记会影响显示字符的字形,字符集也会影响它。因此,函数可以具有以下输入参数:

fontname后缀、字体字符集、字符代码


但下一步是什么?还是我走错了路?

RTF早在Unicode发明之前就已经发明了。它肯定不是ANSI文本,RTF只使用ASCII,它使用了字符集与非ASCII字符的混合,这些字符以十六进制编码,并引用字符集。映射也不完美,许多Unicode代码点没有相应的字符集


您将花费一生的时间创建自己的RTF到Unicode转换器。利用现有的解决方案,大多数平台都有一个。在将成为RichEdit控件的窗口上。如果您使用.NET,那么它特别简单,使用RichTextBox类,分配其Rtf属性并读回其文本属性。它是utf-16编码的Unicode。

RTF早在Unicode发明之前就被发明了。它肯定不是ANSI文本,RTF只使用ASCII,它使用了字符集与非ASCII字符的混合,这些字符以十六进制编码,并引用字符集。映射也不完美,许多Unicode代码点没有相应的字符集


您将花费一生的时间创建自己的RTF到Unicode转换器。利用现有的解决方案,大多数平台都有一个。在将成为RichEdit控件的窗口上。如果您使用.NET,那么它特别简单,使用RichTextBox类,分配其Rtf属性并读回其文本属性。哪个是utf-16编码的Unicode。

这是什么编程语言?此外,字体是不相关的,您只需要将字符集转换为UTF-8这是一个副本,看这里我在C++下在Windows下。我不认为字体是不相关的,因为例如符号、Webding和其他特殊的字体名称会导致问题。fontname后缀也很重要,但我不知道Windows如何处理这些后缀。这是什么编程语言?此外,字体是不相关的,您只需要将字符集转换为UTF-8这是一个副本,看这里我在C++下在Windows下。我不认为字体是不相关的,因为例如符号、Webding和其他特殊的字体名称会导致问题。fontname后缀也很重要,但我不知道Windows如何处理这些后缀。非常感谢你,Hans!我会试试这个,并分享结果。非常感谢你,汉斯!我将尝试这个,并分享结果。