Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/375.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在Java中检测(或最佳猜测)传入字符串编码_Java_Encoding_Utf 8_Decoding_Utf 16 - Fatal编程技术网

在Java中检测(或最佳猜测)传入字符串编码

在Java中检测(或最佳猜测)传入字符串编码,java,encoding,utf-8,decoding,utf-16,Java,Encoding,Utf 8,Decoding,Utf 16,我想知道是否有已知的方法可以检测(或给出最佳猜测)Java中特定字符串的编码 我知道你总是需要一些额外的元数据来说明编码是什么,还有一些最佳实践等等,但是在我所处的情况下,我需要给出最佳近似值 也欢迎通过编程方式区分UTF-8和UTF-16的解决方案或指针。UTF-8编码应易于验证: UTF-8字符串可以通过简单的启发式算法相当可靠地识别。 看一看看一看,尤其是。看一看包含字符检测器的ICU4JUTF-16和UTF-8与URL编码有什么关系?唯一合理的方法是让它们首先指定编码(使用ASCII!

我想知道是否有已知的方法可以检测(或给出最佳猜测)Java中特定字符串的编码

我知道你总是需要一些额外的元数据来说明编码是什么,还有一些最佳实践等等,但是在我所处的情况下,我需要给出最佳近似值


也欢迎通过编程方式区分UTF-8和UTF-16的解决方案或指针。

UTF-8编码应易于验证:

UTF-8字符串可以通过简单的启发式算法相当可靠地识别。


看一看

看一看,尤其是。

看一看包含字符检测器的ICU4J

UTF-16和UTF-8与URL编码有什么关系?唯一合理的方法是让它们首先指定编码(使用ASCII!)作为某种元数据。绝对不要猜。是的,但我没有BOM或任何其他必要的元数据来帮助我。这就是为什么我说了一个最好的猜测。接受这个作为正确答案,因为他给我指出了一个算法,而不是一个现有的工具包。我实际上也喜欢这里使用的方法: