Linux 读取具有unicode字符的文本文件-Python3
我正在尝试读取文本中包含unicode字符(u)和其他标记(\n,\u)的文本文件,下面是一个示例: (u'B9781437714227000962',u'Definition\U2014人类乳头状瘤病毒 (HPV)\u2013阴道粘膜的相关增生,导致 阴道广泛、全层成熟缺失 上皮细胞。\n')Linux 读取具有unicode字符的文本文件-Python3,linux,python-3.x,unicode,ascii,Linux,Python 3.x,Unicode,Ascii,我正在尝试读取文本中包含unicode字符(u)和其他标记(\n,\u)的文本文件,下面是一个示例: (u'B9781437714227000962',u'Definition\U2014人类乳头状瘤病毒 (HPV)\u2013阴道粘膜的相关增生,导致 阴道广泛、全层成熟缺失 上皮细胞。\n') 如何在Linux操作系统中使用python3删除这些unicode标记?要删除unicode转义序列(或者更好:翻译它们),请在python3中: a.encode('utf-8').decode('u
如何在Linux操作系统中使用python3删除这些unicode标记?要删除unicode转义序列(或者更好:翻译它们),请在python3中:
a.encode('utf-8').decode('unicode_escape')
解码部分将unicode转义序列转换为相对的unicode字符。不幸的是,这种(非)转义对字符串不起作用,因此您需要先对字符串进行编码,然后再对其进行解码
但正如问题注释中所指出的,您有一个序列化文档。尝试使用正确的工具将其取消序列化,您将自动获得unicode“取消跳过”部分。看起来您处于一个状态。为什么我的问题被否决??文件上没有说是泡菜,送我的人也没有告诉我是泡菜。无论如何,我尝试取消勾选文件,但它给了我一个错误:_pickle.UnpicklingError:取消勾选堆栈下溢