筛选pyspark数据帧
我有一个名为property的表,它有两列名为property\u id和property\u id 我想获取具有[1,4]属性id的属性id 因此,在本例中,属性1和3具有属性id[1,4]筛选pyspark数据帧,pyspark,pyspark-dataframes,Pyspark,Pyspark Dataframes,我有一个名为property的表,它有两列名为property\u id和property\u id 我想获取具有[1,4]属性id的属性id 因此,在本例中,属性1和3具有属性id[1,4] property_id | property_amenities_id 1 | 1 1 | 4 1 | 6 2 | 3 2 |
property_id | property_amenities_id
1 | 1
1 | 4
1 | 6
2 | 3
2 | 5
3 | 1
3 | 4
我想在pyspark数据帧上应用此筛选器
谁能帮我找到更好的查询
谢谢df.filter(F.col(“属性标识”).isin([1,4])。选择(“属性标识”).distinct().collect()