Dataframe 如何使用pyspark选择数据帧中的值?

Dataframe 如何使用pyspark选择数据帧中的值?,dataframe,pyspark,Dataframe,Pyspark,我试图根据字符串从数据帧中的列中选择值,如UNKNOWN newDF = experimentsDF.select(experimentsDF.labs_col WHEN (experimentsDF.expirenement_desc == 'UNKNOWN')) 我正在使用pyspark,但语法不正确 您能帮我选择实验室中的值吗?Pyspark具有过滤功能来执行此操作: experimentsDF.filter(experimentsDF.expirenement_desc == 'UN

我试图根据字符串从数据帧中的列中选择值,如UNKNOWN

newDF = experimentsDF.select(experimentsDF.labs_col WHEN (experimentsDF.expirenement_desc == 'UNKNOWN')) 
我正在使用pyspark,但语法不正确


您能帮我选择实验室中的值吗?

Pyspark具有过滤功能来执行此操作:

experimentsDF.filter(experimentsDF.expirenement_desc == 'UNKNOWN').select('labs_col')
您还可以使用Where函数:

experimentsDF.where(col('expirenement_desc ')=='UNKOWN').select('labs_col')

谢谢你的帮助。这就是我需要的。