Unicode 未知编码

Unicode 未知编码,unicode,encoding,utf-8,character-encoding,Unicode,Encoding,Utf 8,Character Encoding,有人知道这是什么编码吗 \u042e\u043b\u0438\u044f 我唯一知道的是,这是一个非拉丁字母表中的名称,它在Unicode中是“Julia”。在Unicode中是“Julia”。\u通常用于表示数字Unicode码点引用,在这种情况下,您正在处理Unicode。您可以在他们的代码表中查找相关代码点的精确定义。官方网站上的提供定义范围的概述,同时允许您按值搜索。\u通常用于指示数字Unicode码点引用,在这种情况下,您使用的是Unicode。您可以在他们的代码表中查找相关代码点

有人知道这是什么编码吗

\u042e\u043b\u0438\u044f

我唯一知道的是,这是一个非拉丁字母表中的名称,它在Unicode中是“Julia”。

在Unicode中是“Julia”。

\u
通常用于表示数字Unicode码点引用,在这种情况下,您正在处理Unicode。您可以在他们的代码表中查找相关代码点的精确定义。官方网站上的提供定义范围的概述,同时允许您按值搜索。

\u
通常用于指示数字Unicode码点引用,在这种情况下,您使用的是Unicode。您可以在他们的代码表中查找相关代码点的精确定义。官方网站上的提供定义范围的概述,同时允许您按值搜索。

它看起来像西里尔字母块中的UTF-16字符

U+042E CYRILLIC CAPITAL LETTER YU
U+043B CYRILLIC SMALL LETTER EL
U+0438 CYRILLIC SMALL LETTER I
U+044F CYRILLIC SMALL LETTER YA

它看起来像西里尔字母块中的UTF-16字符

U+042E CYRILLIC CAPITAL LETTER YU
U+043B CYRILLIC SMALL LETTER EL
U+0438 CYRILLIC SMALL LETTER I
U+044F CYRILLIC SMALL LETTER YA
您知道如何使用python获取它吗

原则上,unicode转义:

>>> '\\u042e\\u043b\\u0438\\u044f'.decode('unicode-escape')
u'\u042e\u043b\u0438\u044f'
>>> print _
Юлия   # dependent on your terminal supporting Unicode
但是,这只解码
\u
序列,而这很可能不是您真正想要做的

有许多不同的语言将我们作为字符串文字编码,包括JavaScript和Python。关于其他转义序列如何工作,以及UTF-16代理的处理,每一个都有稍微不同的规则。因此,您确实需要知道您正在处理的确切语言,并使用为该语言设计的解析器

JSON通常是一个很好的第一猜测

您知道如何使用python获取它吗

原则上,unicode转义:

>>> '\\u042e\\u043b\\u0438\\u044f'.decode('unicode-escape')
u'\u042e\u043b\u0438\u044f'
>>> print _
Юлия   # dependent on your terminal supporting Unicode
但是,这只解码
\u
序列,而这很可能不是您真正想要做的

有许多不同的语言将我们作为字符串文字编码,包括JavaScript和Python。关于其他转义序列如何工作,以及UTF-16代理的处理,每一个都有稍微不同的规则。因此,您确实需要知道您正在处理的确切语言,并使用为该语言设计的解析器


JSON通常是一个很好的猜测。

为了澄清,这很可能是Unicode字符串的JavaScript表示。这在Chrome开发者工具控制台中对我很有效:
console.log(“\u042e\u043b\u0438\u044f”)
谢谢Alexander,你知道如何用python获得它吗?我已经尝试过编码/解码,但是没有fortune@user1183090
>>打印(u'\u042e\u043b\u0438\u044f')
应该适合您。这里有一个很好的解释,这很可能是Unicode字符串的JavaScript表示。这在Chrome开发者工具控制台中对我很有效:
console.log(“\u042e\u043b\u0438\u044f”)
谢谢Alexander,你知道如何用python获得它吗?我已经尝试过编码/解码,但是没有fortune@user1183090
>>打印(u'\u042e\u043b\u0438\u044f')
应该适合您。有一个很好的方法。问题是我不能使用打印,因为我必须处理这些字符串,并将名称与遗留数据库中的其他名称进行比较…因此,有没有想法在没有打印的情况下获得结果?您已经得到了结果。字符串
u'\u042e\u043b\u0438\u044f'
就是字符串
u'ЮЮЮЮЮЮЮЮЮЮЮЮЮЮЮЮЮЮб
。问题是我不能使用打印,因为我必须操作这些字符串。字符串
u'\u042e\u043b\u0438\u044f'
就是字符串
u'ЮЮЮЮЮб'
;打印“\\u%04x”“$char”;完成后,可以在读取-n1字符时使用类似
的东西操作这些字符串;打印“\\u%04x”“$char”;完成