Google bigquery 如何获得比一般信息更多的信息;无法分析JSON:未找到活动字段。;ParsedString返回false;无法分析值";在BigQuery负载上?

Google bigquery 如何获得比一般信息更多的信息;无法分析JSON:未找到活动字段。;ParsedString返回false;无法分析值";在BigQuery负载上?,google-bigquery,Google Bigquery,我们第一次尝试BigQuery,使用从mongo提取的json格式的数据。在加载文件时,我一直遇到这个通用的解析错误。但后来我尝试了一个较小的文件子集,20条记录,它加载得很好。这告诉我这不是文件的一般结构,我原本认为这是问题所在。是否有任何方法可以获取有关解析错误的更多信息,例如当发生此错误时,它试图解析的记录字符串 我还尝试使用“最大错误”字段,但也不起作用 这是通过网站。我还通过Google Cloud SDK命令行“bq load…”尝试了这个错误。这个错误很可能是由于一些JSON记录与

我们第一次尝试BigQuery,使用从mongo提取的json格式的数据。在加载文件时,我一直遇到这个通用的解析错误。但后来我尝试了一个较小的文件子集,20条记录,它加载得很好。这告诉我这不是文件的一般结构,我原本认为这是问题所在。是否有任何方法可以获取有关解析错误的更多信息,例如当发生此错误时,它试图解析的记录字符串

我还尝试使用“最大错误”字段,但也不起作用


这是通过网站。我还通过Google Cloud SDK命令行“bq load…”尝试了这个错误。

这个错误很可能是由于一些JSON记录与表模式不符造成的。不清楚您是使用了
模式自动检测
功能,还是为加载提供了模式。但这里有一个可能发生这种错误的例子:

{ "a" : "1" }
{ "a" : { "b" : "2" } }

如果您只有其中的几个记录,并且这些记录是无效的,那么您可以使用加载作业的
max\u bad\u records
选项自动忽略它们。更多详细信息请访问:

我正在进行模式自动检测。还尝试使用max bad records。我们最终能够通过小批量装载取得进展。然后,当坏记录的#小于最大坏记录时,它有时会给出信息更好的错误,类似于数组中的空元素。首先通过某种数据清理/转换管道发送JSON可能是有意义的,以确保您不会丢失数据,并从不一致的记录中获得合理的行为。您知道JSON文件的一般模式(或至少是您感兴趣的字段的模式)吗?使用此选项将允许您选中“忽略空值”框。要添加@Mosha Pasumasky的注释,您可以找到有关如何实现数据流管道以执行一些示例数据清理任务的教程。您也可以使用它,尽管它仍处于测试阶段。