Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/352.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何提取列的所有条目中包含部分匹配字符串的行_Python_Dataframe_Pyspark - Fatal编程技术网

Python 如何提取列的所有条目中包含部分匹配字符串的行

Python 如何提取列的所有条目中包含部分匹配字符串的行,python,dataframe,pyspark,Python,Dataframe,Pyspark,我有一个带有“Errors”列的数据框 我只想过滤出有特定错误的行(比如“E3”)。在本例中,我希望只显示最后一行 为了简单起见,我在这个数据帧中将错误消息替换为“E1、E2等”。但是,在实际场景中,在本例中,我将使用分隔符(“|”)管道包含一长串错误消息 err = 'E3' mask = df.Errors.str.split('|').apply(lambda x: all(e==err for e in x)) df[mask] # student_id name ti

我有一个带有“Errors”列的数据框

我只想过滤出有特定错误的行(比如“E3”)。在本例中,我希望只显示最后一行

为了简单起见,我在这个数据帧中将错误消息替换为“E1、E2等”。但是,在实际场景中,在本例中,我将使用分隔符(“|”)管道包含一长串错误消息

err = 'E3'
mask = df.Errors.str.split('|').apply(lambda x: all(e==err for e in x))

df[mask]
#   student_id       name timestamp    Errors
# 3         s2  sample123        t2  E3|E3|E3
另一种遮罩方式:

mask = df['error'].apply(lambda x: True if not re.sub('E3|\|','',x) else False)

欢迎使用SO-请提供一个,在这种情况下,这特别意味着数据帧应该很容易复制/可复制-这可能不是很好阅读,但很难重新创建版本。
mask = df['error'].apply(lambda x: True if not re.sub('E3|\|','',x) else False)