从日语字符串转换为unicode java_Java_Unicode

从日语字符串转换为unicode java

java unicode

从日语字符串转换为unicode java,java,unicode,Java,Unicode,上载unicode名称的文件时出现问题。上载文件名时的示例“あ.pdf“然后我得到了一个文件名”￣ﾁﾂ.在我的服务器上这是我的上传代码： for (Part part : request.getParts()) { String fileName = extractFileName(part); if(fileName.trim() !=""){ part.write(savePath + File.separator + fi

上载unicode名称的文件时出现问题。上载文件名时的示例“あ.pdf“然后我得到了一个文件名”￣ﾁﾂ.在我的服务器上

这是我的上传代码：

    for (Part part : request.getParts()) {
        String fileName = extractFileName(part);
        if(fileName.trim() !=""){
            part.write(savePath + File.separator + fileName);
        }
    }

谢谢你的回答

谢谢，

关于支持中文、日文和韩文（CJK）字符的错误信息很多Unicode标准支持所有来自JIS X 0208、JIS X 0212、JIS X 0221或JIS X 0213等的CJK字符。无论使用哪种Unicode编码形式：UTF-8、UTF-16或UTF-32，都是如此
UTF-8适用于大部分为拉丁字母的文本。例如，英语，西班牙语，法语，以及大多数web技术，如HTML，CSS，JavaScript。默认情况下，大多数Linux文件都是UTF-8格式的。UTF-8编码系统向后兼容ASCII码。（意思是：如果文件仅包含ASCII字符，则使用UTF-8对文件进行编码将产生与使用ASCII作为编码方案相同的字节序列。）
UTF-16是Unicode的另一种编码系统。使用UTF-16，每个字符至少编码为2个字节，Unicode中常用的字符正好是2个字节对于包含大量汉字的亚洲语言，如中文和日文，UTF-16可创建更小的文件大小
还有UTF-32，它总是每个字符使用4个字节。它创建了更大的文件大小，但更易于解析。目前，UTF-32的使用不多
当今最流行的编码系统：-

1. ASCII. For English. Most widely used before year 2000. 2. UTF-8 of Unicode (used in Linux by default, and much of the Internet) 3. UTF-16 of Unicode (used by Microsoft Windows and Mac OS X's file systems, Java programing language, …) 4. GB 18030 (Used in China, contains all Unicode chars). 5. EUC (Extended Unix Code). Used in Japan. 6. IEC 8859 series (used for most European langs)
另外，请看一下这些：
& . 希望这能解决您的问题。
您可以在java中使用国际化的概念。我建议一个链接并尝试实施。您知道原始字符串采用哪种编码吗？我在客户端使用utf-8