pyspark按上下文计算每列和组中NA的数量
我正在从事databricks项目,并试图计算每列有多少个空值,并按特定上下文(sub_区域)对其进行分组 空值的形式可以是: 没有,楠和娜。 我知道有像isnan这样的功能pyspark按上下文计算每列和组中NA的数量,pyspark,pyspark-sql,Pyspark,Pyspark Sql,我正在从事databricks项目,并试图计算每列有多少个空值,并按特定上下文(sub_区域)对其进行分组 空值的形式可以是: 没有,楠和娜。 我知道有像isnan这样的功能 from pyspark.sql.functions import col, count, isnan, 如何计算每列中NA值的数量或给定的特定值?如何计算每列中特定值的可能重复项?这适用于非空值。。。。我需要一个特定的值
from pyspark.sql.functions import col, count, isnan,
如何计算每列中NA值的数量或给定的特定值?如何计算每列中特定值的可能重复项?这适用于非空值。。。。我需要一个特定的值