Python中的特殊HTML字符转换为ASCII_Python_Ascii_Special Characters_Non Ascii Characters_Html Escape Characters

Python中的特殊HTML字符转换为ASCII

python

Python中的特殊HTML字符转换为ASCII,python,ascii,special-characters,non-ascii-characters,html-escape-characters,Python,Ascii,Special Characters,Non Ascii Characters,Html Escape Characters,我想把我在阅读网页时看到的特殊字符转换成ASCII格式。我试了很多次，但我想不出来。下面我将给出一些用Python存储在字符串中的示例。我不知道网页的当前编码是什么，但我想将其转换为ASCII格式 ApaydÄ±n Ãœnal > want this to Apaydin Unal Íñigo Martínez > want this to Inigo Martinez ÃœstÃ¼nel > want this to Ustunel 谁能帮我编辑：谢谢，我忘了。我正在使

我想把我在阅读网页时看到的特殊字符转换成ASCII格式。我试了很多次，但我想不出来。下面我将给出一些用Python存储在字符串中的示例。我不知道网页的当前编码是什么，但我想将其转换为ASCII格式

ApaydÄ±n Ãœnal > want this to Apaydin Unal
Íñigo Martínez > want this to Inigo Martinez
ÃœstÃ¼nel > want this to Ustunel

谁能帮我

编辑：谢谢，我忘了。我正在使用Python 2.7，请尝试一下：

要检测编码，请参见问题

您使用的Python版本是什么？假设Python2，

MyString.encode（'iso-8859-1'）

。编码在很大程度上取决于您所使用的控制台或输出、Python版本以及数据到达的格式，因此您对其进行的转换略有不同。这会导致错误。UnicodeDecodeError:“ascii”编解码器无法解码位置7:序号不在范围（128）中的字节0xc3。当试图转换字符串的“nmez”时，x.decode（'utf-8'）。encode（'iso-8859-1'，errors='replace'）会将字符串解码为ascii可以理解的内容，然后将其重新编码为输出可以理解的字符编码。这就产生了：

'\xc3？st\xc3\xbcnel>想要在我的控制台中自定义它“

，很可能是因为我没有使用iso-8859-1，我实际上使用的是UTF-8。还可以提到您在哪里阅读此输出，webbrowser，console（如果是，是哪个操作系统），文本文件？我是从m.facebook.com网站上阅读的。这会产生像Y？ld？z和K？lal？这样的字符串，这不是期望的结果。当从facebook读取日期时，您很可能没有使用UTF-8连接，从而使您的数据看起来像这样。

>>> from unidecode import unidecode
>>> unidecode(u'ko\u017eu\u0161\u010dek')
'kozuscek'