Python 删除数据帧中的特殊字符
我已经找到了如何做到这一点的信息,但对我来说没有任何效果。我试图替换特殊字符“ð”。我从csv文件导入了数据,并使用了encoding='latin1',否则会不断出错。但是,一个简单的DF['Column'].str.replace('ð','')不会起作用。我还尝试解码并使用另一篇文章中推荐的字符的十六进制值,但这对我来说仍然不起作用。非常感谢您的帮助,如有必要,我愿意发布代码。请拨打Python 删除数据帧中的特殊字符,python,python-3.x,pandas,dataframe,jupyter-notebook,Python,Python 3.x,Pandas,Dataframe,Jupyter Notebook,我已经找到了如何做到这一点的信息,但对我来说没有任何效果。我试图替换特殊字符“ð”。我从csv文件导入了数据,并使用了encoding='latin1',否则会不断出错。但是,一个简单的DF['Column'].str.replace('ð','')不会起作用。我还尝试解码并使用另一篇文章中推荐的字符的十六进制值,但这对我来说仍然不起作用。非常感谢您的帮助,如有必要,我愿意发布代码。请拨打str.encode,然后拨打str.decode: df.YourCol.str.encode('utf-
str.encode
,然后拨打str.decode
:
df.YourCol.str.encode('utf-8').str.decode('ascii', 'ignore')
如果要对多个列执行此操作,可以切片并调用df.applymap
:
df[col_list].applymap(lambda x: x.encode('utf-8').decode('ascii', 'ignore'))
请记住,这些操作并不到位。因此,您必须将这些列重新分配到正确的位置。谢谢!那到底是干什么的?我只想特别地去掉“ð”而不是别的。它会清除数据帧中的所有非ascii或重音字符。你不知道这个解决方案对我有什么帮助:D