将阿拉伯语的属性文件转换为unicode
我有一个要求,客户将提供阿拉伯语的属性文件,我必须将文件(arabic.properties)转换为unicode。该文件包含500多行。请帮助我编写将“阿拉伯字符”转换为“unicode字符”的代码。使用命令行转到Java文件夹,然后编写:将阿拉伯语的属性文件转换为unicode,unicode,Unicode,我有一个要求,客户将提供阿拉伯语的属性文件,我必须将文件(arabic.properties)转换为unicode。该文件包含500多行。请帮助我编写将“阿拉伯字符”转换为“unicode字符”的代码。使用命令行转到Java文件夹,然后编写: \Java\bin>native2ascii -encoding utf-8 Labels_ar.txt Labels_ar.properties 更新 不确定“不恰当”的确切含义,但请尝试以下场景: 打开记事本,用阿拉伯语写些东西:比如: MyL
\Java\bin>native2ascii -encoding utf-8 Labels_ar.txt Labels_ar.properties
更新不确定“不恰当”的确切含义,但请尝试以下场景:
打开记事本,用阿拉伯语写些东西:比如:
MyLabel = تجربه1
然后将其另存为test.txt,并确保从编码中选择UTF-8
现在从命令行:
native2ascii -encoding utf-8 test.txt test_ar.properties
现在,测试属性包含:
MyLabel = \u062a\u062c\u0631\u0628\u06471
请注意,有时Native2ASCI可能会将
\ufeff
添加为文件中的第一个字符。如果找到它,您需要手动删除它。首先,您必须知道他们将提供给您的文件的编码。“阿拉伯字符”可以描述你可能遇到的单个字母,但如果没有编码,这就像试图训练一只猫或把果冻钉在树上
如果运气好的话,他们会给你一个Unicode编码(UTF-8、UCS-2等),而“转换”将相对轻松。我猜客户机提供的是编码为的文件。我进一步猜测,Unicode实际上是指UTF-8编码。如果这是正确的,那么以下Python 3脚本将执行此操作:
with open("arabic.properties", "r", encoding="cp1256") as infile:
with open("utf8.properties", "w", encoding="utf-8") as outfile:
outfile.write(infile.read())
@user930692那么它已经是Unicode格式的,所以不需要转换。对不起,我的意思是阿拉伯语到UTF-8编码我试过了,但是转换不正确。您使用的是什么编程语言?