Sql 错误:无法访问类型为ARRAY<;的值上的字段元素;结构<;元素字符串>&燃气轮机;在BigQuery中

Sql 错误:无法访问类型为ARRAY<;的值上的字段元素;结构<;元素字符串>&燃气轮机;在BigQuery中,sql,google-cloud-platform,pyspark,google-bigquery,google-cloud-dataproc,Sql,Google Cloud Platform,Pyspark,Google Bigquery,Google Cloud Dataproc,我将一个df从pyspark导出到BigQuery。df有带数组元素的列,如何将数组转换为串联字符串?每当我尝试查询导出的BigQuery表的数组列时,都会出现以下错误 Error: Cannot access field element on a value with type ARRAY<STRUCT<element STRING>> 以下是将df从pyspark导出到BigQuery后生成的BigQuery中的表的架构: 当作为表格查看时,它看起来是这样的:

我将一个df从pyspark导出到BigQuery。df有带数组元素的列,如何将数组转换为串联字符串?每当我尝试查询导出的BigQuery表的数组列时,都会出现以下错误

Error: Cannot access field element on a value with type ARRAY<STRUCT<element STRING>> 
以下是将df从pyspark导出到BigQuery后生成的BigQuery中的表的架构:

当作为表格查看时,它看起来是这样的:

当使用拼花作为中间格式写入BigQuery时,这是一个很好的选择。你能换成兽人吗?方法是:

df.write.format("bigquery").option("table","...").option("temporaryGcsBucket","...").option("intermediateFormat","orc").save()

提供查询的SQL语句,这样我们也可以为您修复它。出于某些原因,将df写入bigquery需要很长时间,有时甚至在操作完成之前终止。有没有办法优化它?
df.write.format("bigquery").option("table","...").option("temporaryGcsBucket","...").option("intermediateFormat","orc").save()