将阿拉伯语的属性文件转换为unicode

将阿拉伯语的属性文件转换为unicode,unicode,Unicode,我有一个要求,客户将提供阿拉伯语的属性文件,我必须将文件(arabic.properties)转换为unicode。该文件包含500多行。请帮助我编写将“阿拉伯字符”转换为“unicode字符”的代码。使用命令行转到Java文件夹,然后编写: \Java\bin>native2ascii -encoding utf-8 Labels_ar.txt Labels_ar.properties 更新 不确定“不恰当”的确切含义,但请尝试以下场景: 打开记事本,用阿拉伯语写些东西:比如: MyL

我有一个要求,客户将提供阿拉伯语的属性文件,我必须将文件(arabic.properties)转换为unicode。该文件包含500多行。请帮助我编写将“阿拉伯字符”转换为“unicode字符”的代码。

使用命令行转到Java文件夹,然后编写:

\Java\bin>native2ascii -encoding utf-8 Labels_ar.txt Labels_ar.properties
更新
不确定“不恰当”的确切含义,但请尝试以下场景:
打开记事本,用阿拉伯语写些东西:比如:

MyLabel = تجربه1
然后将其另存为test.txt,并确保从编码中选择UTF-8

现在从命令行:

native2ascii -encoding utf-8 test.txt test_ar.properties
现在,测试属性包含:

MyLabel = \u062a\u062c\u0631\u0628\u06471

请注意,有时Native2ASCI可能会将
\ufeff
添加为文件中的第一个字符。如果找到它,您需要手动删除它。

首先,您必须知道他们将提供给您的文件的编码。“阿拉伯字符”可以描述你可能遇到的单个字母,但如果没有编码,这就像试图训练一只猫或把果冻钉在树上


如果运气好的话,他们会给你一个Unicode编码(UTF-8、UCS-2等),而“转换”将相对轻松。

我猜客户机提供的是编码为的文件。我进一步猜测,Unicode实际上是指UTF-8编码。如果这是正确的,那么以下Python 3脚本将执行此操作:

with open("arabic.properties", "r", encoding="cp1256") as infile:
    with open("utf8.properties", "w", encoding="utf-8") as outfile:
        outfile.write(infile.read())

@user930692那么它已经是Unicode格式的,所以不需要转换。对不起,我的意思是阿拉伯语到UTF-8编码我试过了,但是转换不正确。您使用的是什么编程语言?