Apache spark Pyspark获取最大值排除NaN
结果是:Apache spark Pyspark获取最大值排除NaN,apache-spark,pyspark,nan,Apache Spark,Pyspark,Nan,结果是: df = spark.createDataFrame([(1.0,100.0, float('nan')), (float('nan'),100.0, 2.0)], ("a", "b")) df.select(F.max(df.a)).show() 我不想要NaN,我该怎么办?你可以做 +------+ |max(a)| +------+ | NaN| +------+ 在应用maxfilter之前,如果max是负数,则会出现问题。 df.na.fill(0)
df = spark.createDataFrame([(1.0,100.0, float('nan')), (float('nan'),100.0, 2.0)], ("a", "b"))
df.select(F.max(df.a)).show()
我不想要NaN,我该怎么办?你可以做
+------+
|max(a)|
+------+
| NaN|
+------+
在应用
max
filter之前,如果max是负数,则会出现问题。
df.na.fill(0)