Python 3.x 根据也具有特殊字符的部分字符串值筛选数据帧
我正在尝试筛选dataframe列中基于dataframe的部分字符串,该字符串将与列表中的值列表相匹配 问题是一些匹配字符串中有特殊字符, 例如: 当我尝试的时候Python 3.x 根据也具有特殊字符的部分字符串值筛选数据帧,python-3.x,regex,pandas,Python 3.x,Regex,Pandas,我正在尝试筛选dataframe列中基于dataframe的部分字符串,该字符串将与列表中的值列表相匹配 问题是一些匹配字符串中有特殊字符, 例如: 当我尝试的时候 pat = '|'.join(criteria_filter['ID']) df_B = detfile_df[detfile_df['ID'].str.contains(pat)] 我得到一份工作 error: nothing to repeat 现在我想这是由于一个bug或者上面的两行代码无法处理特殊字符造成的 您能帮助我解
pat = '|'.join(criteria_filter['ID'])
df_B = detfile_df[detfile_df['ID'].str.contains(pat)]
我得到一份工作
error: nothing to repeat
现在我想这是由于一个bug或者上面的两行代码无法处理特殊字符造成的
您能帮助我解决这个问题吗?您可以通过生成器理解中的
re.escape
对特殊正则字符进行转义:
import re
pat = '|'.join(re.escape(x) for x in criteria_filter['ID'])
谢谢@jezrael,一个类似的问题。。如果我的数据帧中有以特殊字符开头的字符串,并且我将此df写入csv,csv中的输出会被修改为0/空白吗?(特别是以=sign开头的字符串,as=被视为公式开始?@asimo-不确定是否理解,您能更具体地使用示例数据吗?@asimo-因为如果以
=
开头的字符串不是特殊的正则字符,所以它的结构没有问题,让我检查并相应地还原。)
import re
pat = '|'.join(re.escape(x) for x in criteria_filter['ID'])