Linux 读取具有unicode字符的文本文件-Python3_Linux_Python 3.x_Unicode_Ascii

Linux 读取具有unicode字符的文本文件-Python3

linux python-3.x unicode

Linux 读取具有unicode字符的文本文件-Python3,linux,python-3.x,unicode,ascii,Linux,Python 3.x,Unicode,Ascii,我正在尝试读取文本中包含unicode字符（u）和其他标记（\n，\u）的文本文件，下面是一个示例：（u'B9781437714227000962'，u'Definition\U2014人类乳头状瘤病毒（HPV）\u2013阴道粘膜的相关增生，导致阴道广泛、全层成熟缺失上皮细胞。\n'）如何在Linux操作系统中使用python3删除这些unicode标记？要删除unicode转义序列（或者更好：翻译它们），请在python3中： a.encode('utf-8').decode('u

我正在尝试读取文本中包含unicode字符（u）和其他标记（\n，\u）的文本文件，下面是一个示例：

（u'B9781437714227000962'，u'Definition\U2014人类乳头状瘤病毒（HPV）\u2013阴道粘膜的相关增生，导致阴道广泛、全层成熟缺失上皮细胞。\n'）

如何在Linux操作系统中使用python3删除这些unicode标记？

要删除unicode转义序列（或者更好：翻译它们），请在python3中：

a.encode('utf-8').decode('unicode_escape')

解码部分将unicode转义序列转换为相对的unicode字符。不幸的是，这种（非）转义对字符串不起作用，因此您需要先对字符串进行编码，然后再对其进行解码

但正如问题注释中所指出的，您有一个序列化文档。尝试使用正确的工具将其取消序列化，您将自动获得unicode“取消跳过”部分。

看起来您处于一个状态。为什么我的问题被否决？？文件上没有说是泡菜，送我的人也没有告诉我是泡菜。无论如何，我尝试取消勾选文件，但它给了我一个错误：_pickle.UnpicklingError:取消勾选堆栈下溢