Python 从字符串中删除xml unicode字符
我正在努力从字符串中删除xml unicode字符。适应Python 3失败:Python 从字符串中删除xml unicode字符,python,unicode,Python,Unicode,我正在努力从字符串中删除xml unicode字符。适应Python 3失败: s = 'fooСъбbar' s.encode('ascii', errors='ignore') # b'fooСъбbar' 我也试过,但运气不佳: unescape(s).encode('ascii', errors='ignore') # b'fooС
s = 'fooСъбbar'
s.encode('ascii', errors='ignore')
# b'fooСъбbar'
我也试过,但运气不佳:
unescape(s).encode('ascii', errors='ignore')
# b'fooСъbar'
非常感谢您的建议。您可以利用此任务
import html
s = 'fooСъбbar'
s2 = html.unescape(s).encode('ascii', errors='ignore')
print(s2)
输出:
b'foobar'
请注意,非常感谢:)如果XML转义表示ASCII字符呢?。它将被替换,而不是删除。您是要完全删除它们,还是只是正确地翻译它们<代码>打印(html.unescape(s))提供
fooСъбbar
。