Encoding 将阿拉伯语单词转换为windows-1252

Encoding 将阿拉伯语单词转换为windows-1252,encoding,character-encoding,arabic,windows-1252,Encoding,Character Encoding,Arabic,Windows 1252,我正在向oracle数据库插入大量数据 在该数据库中,文本以windows-1252格式存储 事实证明,有很多东西需要输入,所有这些东西都需要转换成这种格式。此外,所有这些数据都是阿拉伯语 有人能帮我找到一个在线转换器或工具,将阿拉伯语单词编码成windows-1252格式吗 *希望细节足够了 --rangana这对Win32 API MultiByteToWideChar和WideCharToMultiByte允许您分别将代码页编码转换为Unicode,将Unicode数据转换为代码页编码。每

我正在向oracle数据库插入大量数据

在该数据库中,文本以windows-1252格式存储

事实证明,有很多东西需要输入,所有这些东西都需要转换成这种格式。此外,所有这些数据都是阿拉伯语

有人能帮我找到一个在线转换器或工具,将阿拉伯语单词编码成windows-1252格式吗

*希望细节足够了


--rangana

这对Win32 API MultiByteToWideChar和WideCharToMultiByte允许您分别将代码页编码转换为Unicode,将Unicode数据转换为代码页编码。每个API都将用于转换的代码页的值作为参数。因此,您可以指定给定代码页的值(例如,阿拉伯语为1256)或使用预定义的标志,例如:

  • CP_ACP:用于当前选定的系统Windows代码页
  • CP_OEMCP:用于当前选择的系统OEM代码页
  • CP_UTF8:用于UTF-16和UTF-8之间的转换

由于windows-1252根本不编码阿拉伯字母,因此进行转换的唯一方法是使用某种音译。这与编码转换完全不同(编码转换不改变字符的标识,只改变其编码表示)

阿拉伯语有大量的音译(罗马化)方案。几乎所有的字母都是不可逆的,几乎所有的字母都不适合全自动处理(主要是因为正常的阿拉伯语书写不表示短元音,但大多数音译方案都表示短元音,即,音译者需要知道单词的发音方式并插入元音字符)


您可以通过转换为windows-1256,然后将windows-1256编码的数据作为原始字节插入数据库来伪造转换。然后,您需要跟踪数据库中每个值的编码,以便知道哪些字节是windows-1252,哪些是真正的windows-1256。这听起来像是一团糟,所以考虑是否有可能将数据库转换为使用UTF-8。< /P> Windows 1252代码页不能代表阿拉伯文文本。它的剧目只包括一组拉丁字符。如果要存储阿拉伯语,则需要使用一种编码,该编码可以容纳要存储的所有字符数据。如今,一个合理的默认值是Unicode。在Unicode出现之前,人们会想出一些难看的解决办法,比如将阿拉伯字节包装在某种容器中,也许是RFC2047。但是使用Unicode,它的设计正是为了解决这样的问题。另请参阅我更愿意询问有关应用程序服务器端的更多信息,我可以帮助您获得更准确的答案,这是在线转换器