Python中的特殊HTML字符转换为ASCII

Python中的特殊HTML字符转换为ASCII,python,ascii,special-characters,non-ascii-characters,html-escape-characters,Python,Ascii,Special Characters,Non Ascii Characters,Html Escape Characters,我想把我在阅读网页时看到的特殊字符转换成ASCII格式。我试了很多次,但我想不出来。下面我将给出一些用Python存储在字符串中的示例。我不知道网页的当前编码是什么,但我想将其转换为ASCII格式 Apaydın Ãœnal > want this to Apaydin Unal Íñigo Martínez > want this to Inigo Martinez Ãœstünel > want this to Ustunel 谁能帮我 编辑: 谢谢,我忘了。我正在使

我想把我在阅读网页时看到的特殊字符转换成ASCII格式。我试了很多次,但我想不出来。下面我将给出一些用Python存储在字符串中的示例。我不知道网页的当前编码是什么,但我想将其转换为ASCII格式

Apaydın Ünal > want this to Apaydin Unal
Íñigo Martínez > want this to Inigo Martinez
Üstünel > want this to Ustunel
谁能帮我

编辑: 谢谢,我忘了。我正在使用Python 2.7,请尝试一下:


要检测编码,请参见问题

您使用的Python版本是什么?假设Python2,
MyString.encode('iso-8859-1')
。编码在很大程度上取决于您所使用的控制台或输出、Python版本以及数据到达的格式,因此您对其进行的转换略有不同。这会导致错误。UnicodeDecodeError:“ascii”编解码器无法解码位置7:序号不在范围(128)中的字节0xc3。当试图转换字符串的“nmez”时,x.decode('utf-8')。encode('iso-8859-1',errors='replace')会将字符串解码为ascii可以理解的内容,然后将其重新编码为输出可以理解的字符编码。这就产生了:
'\xc3?st\xc3\xbcnel>想要在我的控制台中自定义它“
,很可能是因为我没有使用iso-8859-1,我实际上使用的是UTF-8。还可以提到您在哪里阅读此输出,webbrowser,console(如果是,是哪个操作系统),文本文件?我是从m.facebook.com网站上阅读的。这会产生像Y?ld?z和K?lal?这样的字符串,这不是期望的结果。当从facebook读取日期时,您很可能没有使用UTF-8连接,从而使您的数据看起来像这样。
>>> from unidecode import unidecode
>>> unidecode(u'ko\u017eu\u0161\u010dek')
'kozuscek'