Google bigquery 大查询表创建混乱

Google bigquery 大查询表创建混乱,google-bigquery,Google Bigquery,我必须用下面的模式创建一个大的查询表 snippet:STRING,comment_date:TIMESTAMP "Love both of these brands , but the "" buy a $100k car , get or give a pair of $40 shoes "" message seems .",2015-06-22 00:00:00 "All Givens Best Commercial Ever",2015-06-22 00:00:00 我有如下数据

我必须用下面的模式创建一个大的查询表

snippet:STRING,comment_date:TIMESTAMP
"Love both of these brands , but the "" buy a $100k car , get or give a pair of $40 shoes "" message seems .",2015-06-22 00:00:00

"All Givens Best Commercial Ever",2015-06-22 00:00:00
我有如下数据

snippet:STRING,comment_date:TIMESTAMP
"Love both of these brands , but the "" buy a $100k car , get or give a pair of $40 shoes "" message seems .",2015-06-22 00:00:00

"All Givens Best Commercial Ever",2015-06-22 00:00:00
我感到困惑,因为这两行都被接受并插入到表中,尽管在第一行中,所有代码段字符串都位于双引号之间,但它也包含双引号和逗号


为什么大查询在这里不会混淆?

解析CSV时,大查询只在不带引号的逗号上拆分,并且它将双引号
视为单个转义引号字符
在带引号的字符串中遇到时。因此,根据BigQuery,您的输入是有效的CSV。

最好尽可能地获得干净、规则的数据。是CSV文件的松散标准,其中规定了引号字段中的逗号可以,字段中的引号应该加倍。正确的解析通常是一次1个字符。而更丑陋的CSV文件则不遵循这一原则,在引用转义等重要内容的过程中发明或忽略它们。一般负责快速解析CSV的程序员或分析师都会使用逗号分割CSV数据,这在引号字段或引号转义中使用逗号是不正确的。谢谢@Paul我不知道这一点。这意味着大查询正在按上面的方式处理它。如果字符串中有新行呢?然后我需要一些解决方法。你能提出一些建议吗?如果你设置allowQuotedNewlines标志,那么你就可以在引用的CSV字符串中包含换行符。