Bigquery utf-8问题

Bigquery utf-8问题,utf-8,google-bigquery,Utf 8,Google Bigquery,我正在使用java中的GoogleAPI服务bigquery将存储在GoogleCloud存储中的JSON文件中的数据加载到bigquery。 此配置一切正常: Job job = new Job(); JobConfiguration config = new JobConfiguration(); JobConfigurationLoad configLoad = new JobConfigurationLoad(); configLoad.setSchema

我正在使用java中的GoogleAPI服务bigquery将存储在GoogleCloud存储中的JSON文件中的数据加载到bigquery。 此配置一切正常:

    Job job = new Job();
    JobConfiguration config = new JobConfiguration();
    JobConfigurationLoad configLoad = new JobConfigurationLoad();
    configLoad.setSchema(schema);
    configLoad.setDestinationTable(destTable);
    configLoad.setEncoding(StringConstants.UTF_8);
    configLoad.setCreateDisposition("CREATE_IF_NEEDED");
    configLoad.setWriteDisposition("WRITE_APPEND");
    configLoad.setSourceFormat("NEWLINE_DELIMITED_JSON");
    configLoad.setAllowQuotedNewlines(false);
    configLoad.setSourceUris(gcsPaths);
    config.setLoad(configLoad);
    job.setConfiguration(config);
但从2014-01-30 12:00:00 GMT开始,JSON值中的俄语字符开始被问号取代。该应用程序作为守护进程运行,当时甚至没有重新启动。因此,我认为这个问题是由Bigquery中的一些更改引起的。Bigquery现在使用拉丁语-1?
有人知道我该如何解决这个问题吗?

有几个问题:(1)这是JSON还是CSV加载?您在文本中提到JSON,但代码看起来像CSV。(2) 你是如何观察角色替换的?有没有可能是编码问题正在解决,而不是正在解决?对不起,发布了错误的代码片段。在BigQueryUI中,我仍然可以找到以前正确的俄语字符。只有新记录被破坏了。我还使用这些字段分组。所以数据在进入的过程中被破坏了。我还检查了输入文件编码(我从其他服务获取文件)。它没有改变,是utf-8。你能给我(jcondit在google.com上)发一个JSON行无法正确加载的例子吗?谢谢无法再重现该问题。它在某种程度上是固定的,应用程序代码没有任何变化。谢谢你的回复,杰里米。