Python 如何修改pyspark嵌套值
我需要您帮助修改pyspark数据帧。Python 如何修改pyspark嵌套值,python,Python,我需要您帮助修改pyspark数据帧。 我有以下几个问题 { "name" : "April", "surname" : "Black", "contact" : { "phone" : 0022558844, "email" : april.black@mail.com }, "address" :
我有以下几个问题
{
"name" : "April",
"surname" : "Black",
"contact" : {
"phone" : 0022558844,
"email" : april.black@mail.com
},
"address" : "some address"
}
我已经将它读入pyspark df,我想更改电子邮件的值,我试着用以下方法来做
df=spark.read(file.json)
df=df。选择(“*”,“联系人。*”)。带列(“邮件”,亮起(“新建”)。mail@mail.com"))
但是我在df中添加了新的列
name | surname | contact | address | phone | mail
如何在不修改df结构的情况下执行更改?我可以添加新字段作为第二封邮件吗