Google bigquery 大查询表创建混乱_Google Bigquery

Google bigquery 大查询表创建混乱

google-bigquery

Google bigquery 大查询表创建混乱,google-bigquery,Google Bigquery,我必须用下面的模式创建一个大的查询表 snippet:STRING,comment_date:TIMESTAMP "Love both of these brands , but the "" buy a $100k car , get or give a pair of $40 shoes "" message seems .",2015-06-22 00:00:00 "All Givens Best Commercial Ever",2015-06-22 00:00:00 我有如下数据

我必须用下面的模式创建一个大的查询表

snippet:STRING,comment_date:TIMESTAMP

"Love both of these brands , but the "" buy a $100k car , get or give a pair of $40 shoes "" message seems .",2015-06-22 00:00:00

"All Givens Best Commercial Ever",2015-06-22 00:00:00

我有如下数据

snippet:STRING,comment_date:TIMESTAMP

"Love both of these brands , but the "" buy a $100k car , get or give a pair of $40 shoes "" message seems .",2015-06-22 00:00:00

"All Givens Best Commercial Ever",2015-06-22 00:00:00

我感到困惑，因为这两行都被接受并插入到表中，尽管在第一行中，所有代码段字符串都位于双引号之间，但它也包含双引号和逗号

为什么大查询在这里不会混淆？

解析CSV时，大查询只在不带引号的逗号上拆分，并且它将双引号

“

视为单个转义引号字符

“

在带引号的字符串中遇到时。因此，根据BigQuery，您的输入是有效的CSV。

最好尽可能地获得干净、规则的数据。是CSV文件的松散标准，其中规定了引号字段中的逗号可以，字段中的引号应该加倍。正确的解析通常是一次1个字符。而更丑陋的CSV文件则不遵循这一原则，在引用转义等重要内容的过程中发明或忽略它们。一般负责快速解析CSV的程序员或分析师都会使用逗号分割CSV数据，这在引号字段或引号转义中使用逗号是不正确的。谢谢@Paul我不知道这一点。这意味着大查询正在按上面的方式处理它。如果字符串中有新行呢？然后我需要一些解决方法。你能提出一些建议吗？如果你设置allowQuotedNewlines标志，那么你就可以在引用的CSV字符串中包含换行符。