Dataframe where子句值的pyspark数据帧计数等于
下面是示例数据帧 我在中有一列带有'id',考虑到where子句中的vaule等于“number”,我需要带有count number的新数据帧,以及带有vaule和count的新数据帧 源df和所需的newdf,带有df计数Dataframe where子句值的pyspark数据帧计数等于,dataframe,apache-spark,pyspark,Dataframe,Apache Spark,Pyspark,下面是示例数据帧 我在中有一列带有'id',考虑到where子句中的vaule等于“number”,我需要带有count number的新数据帧,以及带有vaule和count的新数据帧 源df和所需的newdf,带有df计数 任何建议:只需分组并计数: newdf = df.groupBy('Id').count()
任何建议:只需分组并计数:
newdf = df.groupBy('Id').count()