是select distinct().count()是pyspark数据帧吗?

是select distinct().count()是pyspark数据帧吗?,pyspark,Pyspark,我看到了 df.select(“name”).distinct().count() <br/> df.select(“name”).distinct().count() 这是pyspark数据帧吗?还是熊猫数据帧?count()是spark中的一个操作,因此您将返回spark数据帧的计数 仅供参考,select和distinct是将返回数据帧的转换。由于spark遵循惰性计算,所以在调用action之前,spark中不会发生任何计算(在大多数情况下) @dailygirlflow

我看到了

df.select(“name”).distinct().count() <br/>
df.select(“name”).distinct().count()
这是pyspark数据帧吗?还是熊猫数据帧?

count()是spark中的一个操作,因此您将返回spark数据帧的计数


仅供参考,select和distinct是将返回数据帧的转换。由于spark遵循惰性计算,所以在调用action之前,spark中不会发生任何计算(在大多数情况下)

@dailygirlflower如果这是你想要的,请接受答案