在Java中检测(或最佳猜测)传入字符串编码
我想知道是否有已知的方法可以检测(或给出最佳猜测)Java中特定字符串的编码 我知道你总是需要一些额外的元数据来说明编码是什么,还有一些最佳实践等等,但是在我所处的情况下,我需要给出最佳近似值在Java中检测(或最佳猜测)传入字符串编码,java,encoding,utf-8,decoding,utf-16,Java,Encoding,Utf 8,Decoding,Utf 16,我想知道是否有已知的方法可以检测(或给出最佳猜测)Java中特定字符串的编码 我知道你总是需要一些额外的元数据来说明编码是什么,还有一些最佳实践等等,但是在我所处的情况下,我需要给出最佳近似值 也欢迎通过编程方式区分UTF-8和UTF-16的解决方案或指针。UTF-8编码应易于验证: UTF-8字符串可以通过简单的启发式算法相当可靠地识别。 看一看看一看,尤其是。看一看包含字符检测器的ICU4JUTF-16和UTF-8与URL编码有什么关系?唯一合理的方法是让它们首先指定编码(使用ASCII!
也欢迎通过编程方式区分UTF-8和UTF-16的解决方案或指针。UTF-8编码应易于验证: UTF-8字符串可以通过简单的启发式算法相当可靠地识别。
看一看看一看,尤其是。看一看包含字符检测器的ICU4JUTF-16和UTF-8与URL编码有什么关系?唯一合理的方法是让它们首先指定编码(使用ASCII!)作为某种元数据。绝对不要猜。是的,但我没有BOM或任何其他必要的元数据来帮助我。这就是为什么我说了一个最好的猜测。接受这个作为正确答案,因为他给我指出了一个算法,而不是一个现有的工具包。我实际上也喜欢这里使用的方法: