试图在python中解码utf-8编码的json时出现问题

试图在python中解码utf-8编码的json时出现问题,python,json,character-encoding,Python,Json,Character Encoding,我确实有一个json文件,我正在尝试读取 Json在文件中包含以下文本,我正试图用以下文本后面的代码对其进行解码 Silikon Ersatzpl\u00ef\u00bf\u00bdttchen再生传感器 with open("file_name", encoding = "utf-8") as file: pdf_labels = json.loads(file.read()) 当我尝试用json模块加载它并指定utf-8编码时,我得到

我确实有一个json文件,我正在尝试读取

Json在文件中包含以下文本,我正试图用以下文本后面的代码对其进行解码

Silikon Ersatzpl\u00ef\u00bf\u00bdttchen再生传感器

with open("file_name", encoding = "utf-8") as file:
        pdf_labels = json.loads(file.read())
当我尝试用json模块加载它并指定utf-8编码时,我得到了一些奇怪的结果

“\u00ef\u00bf\u00bd”将变成“èè½”,而不是所需的“ä”

所需的输出应如下所示

Silikon Ersatzplättchen摄政传感器

with open("file_name", encoding = "utf-8") as file:
        pdf_labels = json.loads(file.read())

请不要太苛刻,这是我的第一个问题:)

文件内容已损坏,可能是由于在某些时候被错误解码。文件是如何创建的?ä的UTF-8序列是
\u00e4
,因此您的数据肯定不是UTF-8。根据它也不是UTF-16或UTF-32。这意味着您的输入文件要么是以不同的编码保存的,要么是出现了问题,字符被替换为一些垃圾。此答案的第一段有点相关:。长话短说:我同意之前的评论;文件中的数据已损坏。@snakecharmerb我需要与创建这些数据的同事核实:)感谢您的回答。@jurez感谢链接和见解,