Apache spark uctI已经添加了printSchema,您是对的,它是一个能够获得所需输出的结构。不必获取列的索引,只需调用它,因为它是结构化的。真的很感谢你的帮助,我已经在这上面呆了一段时间了@Rukgo是的,您必须按名称而不是位置获取字段。我会发布更新。 +----
Apache spark uctI已经添加了printSchema,您是对的,它是一个能够获得所需输出的结构。不必获取列的索引,只需调用它,因为它是结构化的。真的很感谢你的帮助,我已经在这上面呆了一段时间了@Rukgo是的,您必须按名称而不是位置获取字段。我会发布更新。 +----,apache-spark,pyspark,apache-spark-sql,Apache Spark,Pyspark,Apache Spark Sql,uctI已经添加了printSchema,您是对的,它是一个能够获得所需输出的结构。不必获取列的索引,只需调用它,因为它是结构化的。真的很感谢你的帮助,我已经在这上面呆了一段时间了@Rukgo是的,您必须按名称而不是位置获取字段。我会发布更新。 +------------------+--------------------+ | cid | Services| +------------------+--------------------+ |
uctI已经添加了printSchema,您是对的,它是一个能够获得所需输出的结构。不必获取列的索引,只需调用它,因为它是结构化的。真的很感谢你的帮助,我已经在这上面呆了一段时间了@Rukgo是的,您必须按名称而不是位置获取字段。我会发布更新。
+------------------+--------------------+
| cid | Services|
+------------------+--------------------+
|845124826013182686| [112931, serv1]|
|845124826013182686| [146936, serv1]|
|845124826013182686| [32718, serv2]|
|845124826013182686| [28839, serv2]|
|845124826013182686| [8710, serv2]|
|845124826013182686| [2093140, serv3]|
+------------------+--------------------+------------------+--------------------+
| cid | serv1 | serv2 | serv3 |
+------------------+--------------------+------------------+--------------------+
|845124826013182686| 259867 | 70267 | 2093140 |
root
|-- clusterId: string (nullable = true)
|-- col: array (nullable = true)
| |-- element: struct (containsNull = true)
| | |-- cpuCoreInSeconds: long (nullable = true)
| | |-- name: string (nullable = true)