如何在java中检查编码?
我面临一个关于编码的问题 例如,我有一条XML格式的消息,其格式编码为“UTF-8”如何在java中检查编码?,java,android,Java,Android,我面临一个关于编码的问题 例如,我有一条XML格式的消息,其格式编码为“UTF-8” 苹果 1.3 橙色 1.2 ....... 现在,此消息支持多种语言: 繁体中文(big5) 简体中文 英语(utf-8) 并且它只会更改特定字段中的编码。 比如(繁体中文), 蘋果 1.3 橙 1.2 ....... 只有“蘋果" 及"橙“正在使用big5,”和”仍在使用utf-8。 1.3和1.2正在使用utf-8 如何知道哪个单词使用了不同的编码?似乎提供XML的人提供了不正确的XML。他们
苹果
1.3
橙色
1.2
.......
现在,此消息支持多种语言:
- 繁体中文(big5)
- 简体中文
- 英语(utf-8)
并且它只会更改特定字段中的编码。
比如(繁体中文), 蘋果 1.3 橙 1.2 ....... 只有“蘋果" 及"橙“正在使用big5,
和”
仍在使用utf-8。”
和1.3
正在使用utf-81.2
如何知道哪个单词使用了不同的编码?似乎提供XML的人提供了不正确的XML。他们应该使用一致的编码 是一个很好的启发式字符集检测器。 它是Firefox中用于检测内容类型或BOM中缺少字符集的页面编码的端口
如果无法让提供程序修复错误的XML文件中的子字符串的输出,您可以使用它来尝试找出子字符串的编码。您应该在一个XML文件中只使用一种编码。在UTF_8编码中有big5字符的对应项。因为我无法让提供程序修复输出,所以我应该我自己处理它,我不能在这个项目中使用扩展库 我只能这样解决
String str = new String(big5String.getByte("UTF-8"));
在显示消息之前。这不是一个好的解决方案,但我只知道用这种方法解决问题。有人有其他更好的解决方案吗?
String str = new String(big5String.getByte("UTF-8"));