字符串中显示的字符,如何使用python删除它们
我有两条看起来一样但不一样的线字符串中显示的字符,如何使用python删除它们,python,python-3.x,Python,Python 3.x,我有两条看起来一样但不一样的线 $ more /tmp/1 '[FORM-15801] $ more /tmp/2 '[FORM‑15801] 我看到这里的人物 $ sed -n l /tmp/1 '[FORM-15801]$ $ sed -n l /tmp/2 '[FORM\342\200\22115801]$ 在python中,如何将/tmp/2的内容转换为类似于/tmp/2的内容?您可以使用该模块 从PyPI页面: Unidecode提供的是一条中间道路:函数Unidecode(
$ more /tmp/1
'[FORM-15801]
$ more /tmp/2
'[FORM‑15801]
我看到这里的人物
$ sed -n l /tmp/1
'[FORM-15801]$
$ sed -n l /tmp/2
'[FORM\342\200\22115801]$
在python中,如何将/tmp/2的内容转换为类似于/tmp/2的内容?您可以使用该模块
从PyPI页面:
Unidecode提供的是一条中间道路:函数Unidecode()
获取Unicode数据并尝试用ASCII字符(即0x00和0x7F之间的通用可显示字符)表示它,当两个字符集之间的映射被选择为接近使用美国键盘的人所选择的时,所采取的妥协
它们看起来不一样。顶部包含一个en破折号–(U+2013),编码为UTF8。