在python中删除字符串中的奇怪字符

在python中删除字符串中的奇怪字符,python,replace,Python,Replace,我必须解析一些从web获取的web数据。很有可能web内容可以是不同的区域语言,而我正在处理这些语言时没有任何问题。但在某些字符串中出现了一些无效字符,如 我是沃克林 8qî4½MèDèQ+Rè7èy&53è8èg/èaèaèyè5+Bè223;èk.cèWèkèkèfèaèfè 每日统计 我必须删除这些奇怪的字符并提取有效字符串。我使用的是python。我使用utf-8对每个字符串进行编码。如果你说的奇怪不是ascii,你可以尝试: import string "".join(filter(l

我必须解析一些从web获取的web数据。很有可能web内容可以是不同的区域语言,而我正在处理这些语言时没有任何问题。但在某些字符串中出现了一些无效字符,如

我是沃克林 8qî4½MèDèQ+Rè7èy&53è8èg/èaèaèyè5+Bè223;èk.cèWèkèkèfèaèfè 每日统计


我必须删除这些奇怪的字符并提取有效字符串。我使用的是python。我使用utf-8对每个字符串进行编码。

如果你说的奇怪不是ascii,你可以尝试:

import string
"".join(filter(lambda char: char in string.printable, s))
你的绳子在哪里。 以下是一些可以筛选的字符串常量:

这些可能不是奇怪的字符。您只是使用了错误的编码……如何定义“有效字符串”?@juanpa.arrivillaga或“奇怪”字符?:)许多程序都要求我用utf8编码字符串