从HBase到CSV的多字节字符导出产生错误数据

从HBase到CSV的多字节字符导出产生错误数据,csv,export,hbase,Csv,Export,Hbase,我使用模板将HBase表中的数据导出到CSV文件中,但是我遇到了明显的编码问题。数据全部使用UTF-8存储,使用了多个不同的字符集(俄语、汉语、阿拉伯语等) 这是导出数据的主循环 for(HBaseCol column: columns) { byte[] val = result.getValue(column.family.getBytes("UTF-8"), column.qualifier.getBytes("UTF-8")); if (val != null) { //S

我使用模板将HBase表中的数据导出到CSV文件中,但是我遇到了明显的编码问题。数据全部使用UTF-8存储,使用了多个不同的字符集(俄语、汉语、阿拉伯语等)

这是导出数据的主循环

for(HBaseCol column: columns) {

byte[] val = result.getValue(column.family.getBytes("UTF-8"), column.qualifier.getBytes("UTF-8"));

if (val != null) {

    //System.out.println(new String(val,"UTF-8"));
    values.add(new String(val,"UTF-8"));
} else {
    values.add("");
}
}
带有System.out.println()的数据将导致??????而CSV文件中的数据是行话,带有随机字符等


有什么见解吗?谢谢。

答案其实很简单。我使用的CSV导出器无法处理UTF-8。最后,我将数据导出到内存,然后将其直接插入MySQL