Python 3.x 需要帮助从pysaprk中的嵌套JSON中提取对象吗

Python 3.x 需要帮助从pysaprk中的嵌套JSON中提取对象吗,python-3.x,pyspark-sql,Python 3.x,Pyspark Sql,我的JSON列值如下所示 [{“item”:“54509485”,“id”:“1234”,“rule”:“9383”,“issue_type”:[],“rule_message”:“这是json数据”,“sample_attributes”:[“shicode”,“measurement”],“impacted”:[“Child”],[],“_blocker的类型”:[]] 我只想使用pyspark代码使用dataframe获取对象“item”、“rule”、“sample_attributes

我的JSON列值如下所示

[{“item”:“54509485”,“id”:“1234”,“rule”:“9383”,“issue_type”:[],“rule_message”:“这是json数据”,“sample_attributes”:[“shicode”,“measurement”],“impacted”:[“Child”],[],“_blocker的类型”:[]]


我只想使用pyspark代码使用dataframe获取对象“item”、“rule”、“sample_attributes”

如果您获得了pyspark.sql.dataframe.dataframe,可以通过以下方式实现:

data.select(data.column_name.item, data.column_name.rule, data.column_name.sample_attributes)
其中data是您的数据帧,column_name是您的列名