Pyspark 在Spark中打印数据框列的类型

Pyspark 在Spark中打印数据框列的类型,pyspark,Pyspark,我尝试在Spark数据帧上使用VectorAssembler,它抱怨它不支持StringType。我的数据框有2126列 打印所有列类型的编程方式是什么 试试看: >>> for name, dtype in df.dtypes: ... print(name, dtype) 或 df.printSchema()将以易于理解的格式打印数据帧架构 >>> df.schema

我尝试在Spark数据帧上使用VectorAssembler,它抱怨它不支持StringType。我的数据框有2126列

打印所有列类型的编程方式是什么

试试看:

>>> for name, dtype in df.dtypes:
...     print(name, dtype)

df.printSchema()
将以易于理解的格式打印数据帧架构

>>> df.schema