Dataframe 如何使用pyspark选择数据帧中的值?
我试图根据字符串从数据帧中的列中选择值,如UNKNOWNDataframe 如何使用pyspark选择数据帧中的值?,dataframe,pyspark,Dataframe,Pyspark,我试图根据字符串从数据帧中的列中选择值,如UNKNOWN newDF = experimentsDF.select(experimentsDF.labs_col WHEN (experimentsDF.expirenement_desc == 'UNKNOWN')) 我正在使用pyspark,但语法不正确 您能帮我选择实验室中的值吗?Pyspark具有过滤功能来执行此操作: experimentsDF.filter(experimentsDF.expirenement_desc == 'UN
newDF = experimentsDF.select(experimentsDF.labs_col WHEN (experimentsDF.expirenement_desc == 'UNKNOWN'))
我正在使用pyspark,但语法不正确
您能帮我选择实验室中的值吗?Pyspark具有过滤功能来执行此操作:
experimentsDF.filter(experimentsDF.expirenement_desc == 'UNKNOWN').select('labs_col')
您还可以使用Where函数:
experimentsDF.where(col('expirenement_desc ')=='UNKOWN').select('labs_col')
谢谢你的帮助。这就是我需要的。