Python:用“常规”替换最小化的特殊字符
在给定的字符串列表中:Python:用“常规”替换最小化的特殊字符,python,python-3.x,special-characters,Python,Python 3.x,Special Characters,在给定的字符串列表中: [“duplex 4 pièces 84 m²”、“zapatos nº37”、“toyota rav4 3ªserie 2011”] 需要将字符“非最小化”,即²->2,º->o,ª->a等等(可能还有其他最小化的字符) 我试图找到一种方法来完成这项工作,而不是硬编码所有可能的更换案例。如有任何建议,将不胜感激 unidecode模块似乎很有效: >>> import unidecode >>> unidecode.unidecode
[“duplex 4 pièces 84 m²”、“zapatos nº37”、“toyota rav4 3ªserie 2011”]
需要将字符“非最小化”,即²->2
,º->o
,ª->a
等等(可能还有其他最小化的字符)
我试图找到一种方法来完成这项工作,而不是硬编码所有可能的更换案例。如有任何建议,将不胜感激
unidecode
模块似乎很有效:
>>> import unidecode
>>> unidecode.unidecode('² ª º')
'2 a o'
还有unicodedata
模块:
>>> import unicodedata
>>> unicodedata.normalize('NFKD', '² ª º')
'2 a o'