Google bigquery 未处理文件的其余部分
状态显示为success,但文件并未实际传输到big queryGoogle bigquery 未处理文件的其余部分,google-bigquery,Google Bigquery,状态显示为success,但文件并未实际传输到big query # bq show -j abc Job Type State Start Time Duration Bytes Processed ---------- --------- ----------------- ---------- ----------------- load SUCCESS 05 Jul 15:32:45 0:26:24
# bq show -j abc
Job Type State Start Time Duration Bytes Processed
---------- --------- ----------------- ---------- -----------------
load SUCCESS 05 Jul 15:32:45 0:26:24
从web界面,我可以看到实际的错误
Line:9732968, Too few columns: expected 27 column(s) but got 9 column(s)
Line:10893908 / Field:1, Bad character (ASCII 0) encountered. Rest of file not processed.
1) 我如何知道哪些坏角色需要删除
2) 为什么“成功”显示为工作状态
更新:
工作编号:汇总表\u 2012\u 07\u 09\u至\u 2012\u 07\u 10a2
我在命令提示下遇到的错误:
加载操作中的BigQuery错误:后端错误
许多行根本没有被处理。来自web界面的详细信息:
行:9857286/字段:1,遇到错误字符(ASCII 0):字段以:
行:9857287/字段:1,遇到错误字符(ASCII 0)。未处理文件的其余部分
在第二次尝试中成功处理的所有行: 工作编号:总结2012年07月09日至2012年07日 更新2: 行:174952407/字段:1,遇到错误字符(ASCII 0)。未处理文件的其余部分
工作ID:Job_19890847cbc3410495c3cecaf79b31fb很抱歉反应太慢,假日周末意味着bigquery团队的大多数人没有回答支持问题。“坏字符”看起来可能是一些gzip文件中的已知错误,我们在文件末尾错误地检测到ascii 0值
如果作业实际失败但报告成功,这听起来像是个问题,但我们需要失败作业的作业id才能进行调试。另外,如果您可以复制它,这将很有帮助,因为我们可能不再有原始作业的日志。您可以发送返回成功但未实际添加数据的作业的作业id吗?它在文件末尾失败,因此我想可以忽略此错误。