Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Linux 读取具有unicode字符的文本文件-Python3_Linux_Python 3.x_Unicode_Ascii - Fatal编程技术网

Linux 读取具有unicode字符的文本文件-Python3

Linux 读取具有unicode字符的文本文件-Python3,linux,python-3.x,unicode,ascii,Linux,Python 3.x,Unicode,Ascii,我正在尝试读取文本中包含unicode字符(u)和其他标记(\n,\u)的文本文件,下面是一个示例: (u'B9781437714227000962',u'Definition\U2014人类乳头状瘤病毒 (HPV)\u2013阴道粘膜的相关增生,导致 阴道广泛、全层成熟缺失 上皮细胞。\n') 如何在Linux操作系统中使用python3删除这些unicode标记?要删除unicode转义序列(或者更好:翻译它们),请在python3中: a.encode('utf-8').decode('u

我正在尝试读取文本中包含unicode字符(u)和其他标记(\n,\u)的文本文件,下面是一个示例:

(u'B9781437714227000962',u'Definition\U2014人类乳头状瘤病毒 (HPV)\u2013阴道粘膜的相关增生,导致 阴道广泛、全层成熟缺失 上皮细胞。\n')


如何在Linux操作系统中使用python3删除这些unicode标记?

要删除unicode转义序列(或者更好:翻译它们),请在python3中:

a.encode('utf-8').decode('unicode_escape')
解码部分将unicode转义序列转换为相对的unicode字符。不幸的是,这种(非)转义对字符串不起作用,因此您需要先对字符串进行编码,然后再对其进行解码


但正如问题注释中所指出的,您有一个序列化文档。尝试使用正确的工具将其取消序列化,您将自动获得unicode“取消跳过”部分。

看起来您处于一个状态。为什么我的问题被否决??文件上没有说是泡菜,送我的人也没有告诉我是泡菜。无论如何,我尝试取消勾选文件,但它给了我一个错误:_pickle.UnpicklingError:取消勾选堆栈下溢