Google bigquery 在BigQuery SQL中跨多个字段拆分函数_Google Bigquery_Bigquery Standard Sql

Google bigquery 在BigQuery SQL中跨多个字段拆分函数

google-bigquery

Google bigquery 在BigQuery SQL中跨多个字段拆分函数,google-bigquery,bigquery-standard-sql,Google Bigquery,Bigquery Standard Sql,我有这样的数据：每列在一行中具有相同数量的元素，其中第一列中的第一个元素对应于第二列中的第一个元素，以此类推我怎样才能把它展平以得到下面的结果对于单个列，我可以通过将交叉联接与unest组合来实现这一点，但我无法将其用于多个列，因为联接最终会创建多个变体，并且unest会丢失数组的顺序，因此我无法匹配它们如果我是从头开始构建数组，我会在其中使用某种STRUCT元素，但是当数组是从SPLIT（）创建的时候，我找不到一种方法来实现这一点。带偏移量的

我有这样的数据：

每列在一行中具有相同数量的元素，其中第一列中的第一个元素对应于第二列中的第一个元素，以此类推

我怎样才能把它展平以得到下面的结果

对于单个列，我可以通过将

交叉联接

与

unest

组合来实现这一点，但我无法将其用于多个列，因为联接最终会创建多个变体，并且

unest

会丢失数组的顺序，因此我无法匹配它们

如果我是从头开始构建数组，我会在其中使用某种

STRUCT

元素，但是当数组是从

SPLIT（）

创建的时候，我找不到一种方法来实现这一点。

带偏移量的

是你的朋友吗：
WITH strings AS (
  SELECT "a,b,c" a, "aa,bb,cc" b
  UNION ALL
  SELECT "a1,b1,c1" a, "aa1,bb1,cc1" b
)

SELECT x_a, x_b
FROM strings
  , UNNEST(SPLIT(a)) x_a WITH OFFSET o_a 
  JOIN UNNEST(SPLIT(b)) x_b WITH OFFSET o_b
  ON o_a=o_b

BigQuery标准SQL的另一种方法如下所示
#standardSQL
WITH `project.dataset.table` AS (
  SELECT 1 id, 'a|b|c' col1, 'n|o|p' col2 UNION ALL
  SELECT 2, 'd|e', 'q|r' UNION ALL
  SELECT 3, 'f|g|h|i', 's|t|u|v' UNION ALL
  SELECT 4, 'j', 'w' UNION ALL
  SELECT 5, 'k|l|m', 'x|y|z'
)
SELECT 
  id, 
  SPLIT(col1, '|')[SAFE_ORDINAL(pos)] value1, 
  SPLIT(col2, '|')[SAFE_ORDINAL(pos)] value2
FROM `project.dataset.table`,
UNNEST(GENERATE_ARRAY(1, ARRAY_LENGTH(SPLIT(col1, '|')))) pos   

预期结果
Row id  value1  value2   
1   1   a       n    
2   1   b       o    
3   1   c       p    
4   2   d       q    
5   2   e       r    
6   3   f       s    
7   3   g       t    
8   3   h       u    
9   3   i       v    
10  4   j       w    
11  5   k       x    
12  5   l       y    
13  5   m       z