Apache spark 将字符串类型列中的空值替换为零
我需要将字符串类型列中的空值替换为0。 数据如下所示:Apache spark 将字符串类型列中的空值替换为零,apache-spark,replace,pyspark,apache-spark-sql,null,Apache Spark,Replace,Pyspark,Apache Spark Sql,Null,我需要将字符串类型列中的空值替换为0。 数据如下所示: df.groupBy('content').count().show() +---------------+------+ | content| count| +---------------+------+ | videos| 754| | food-news| 76151| | null| 39| | uk| 23879| 我试过这个: d
df.groupBy('content').count().show()
+---------------+------+
| content| count|
+---------------+------+
| videos| 754|
| food-news| 76151|
| null| 39|
| uk| 23879|
我试过这个:
df.na.fill(0).show()
但是这段代码只处理int类型的列。如何将其替换为字符串类型列
谢谢。也用字符串“0”填充:
df = df.na.fill(0).na.fill('0')
在应用了你的代码后,我运行了
df.groupBy('my_column').count().show()
我仍然在列表中看到null
。@Chique_code你做了什么df=df.na.fill('0')
?只需执行df.na.fill('0')
将不会修改df
。我更新了我的答案来反映这一点。啊!这就成功了。很抱歉。我已经接受了答案,并投了赞成票。