用unicode代码(Python)替换文件中的特殊字符

用unicode代码(Python)替换文件中的特殊字符,python,file,unicode,replace,special-characters,Python,File,Unicode,Replace,Special Characters,我有一个有趣的问题。假设有一个字符列表及其匹配的unicode表示形式: list_of_special_chars = [ ('Ą', b'\u0104'), ('ą', b'\u0105'), ('Ę', b'\u0118'), ('ę', b'\u0119'), ('Ó', b'\xd3'), ('ó', b'\xf3'), ('Ć', b'\u0106'), ('ć', b'\u0107'), ('Ł', b'\u0

我有一个有趣的问题。假设有一个字符列表及其匹配的unicode表示形式:

list_of_special_chars = [
    ('Ą', b'\u0104'),
    ('ą', b'\u0105'),
    ('Ę', b'\u0118'),
    ('ę', b'\u0119'),
    ('Ó', b'\xd3'),
    ('ó', b'\xf3'),
    ('Ć', b'\u0106'),
    ('ć', b'\u0107'),
    ('Ł', b'\u0141'),
    ('ł', b'\u0142'),
    ('Ń', b'\u0143'),
    ('ń', b'\u0144'),
    ('Ś', b'\u015a'),
    ('ś', b'\u015b'),
    ('Ź', b'\u0179'),
    ('ź', b'\u017a'),
    ('Ż', b'\u017b'),
    ('ż', b'\u017c')
]

现在,考虑有一个带有这个短语的文本文件:<强> CZE*,Jas-Si-Masz?< /强>

如何将文本替换到文件中,以创建一个新文件,如下所示:Cze\u015b\u0107,jak si\u0119 masz?


我尝试了不同的方法,但由于python处理字符串的方式,我无法解决此类问题。例如,
“Czesć”。replace(“ć”,“\u0107”)
始终是同一个词。

您需要转义反斜杠,以便
\u
不会被视为Python转义序列的开始

"Czesć".replace("ć", "\\u0107")

你为什么要这么做?您正在用自己的专有编码替换文件已经使用的任何标准编码。我必须编辑一些JavaScript文件,并使用python处理它们。您的python版本是什么?“编辑一些JavaScript文件”是什么意思?文本看起来不像javascript源代码。您是否考虑过json?看起来很感谢你的回复,但逃跑正是我想要的。这是一个复杂的场景,我不能给你更多的信息。该代码是我用来打开和处理JavaScript文件的python脚本的一部分。