Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/307.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 将Unicode实体转换为Unicode文本_Python_Unicode - Fatal编程技术网

Python 将Unicode实体转换为Unicode文本

Python 将Unicode实体转换为Unicode文本,python,unicode,Python,Unicode,Python能否将Unicode实体转换为Unicode? ex)\u0639\u0631\u0628\u0649至 我想要完全一样的事情可以做 这将帮助我解析JSON unicode实体以生成有效的URL ex)'S\\u00f8ren Kierkegaard'->https://en.wikipedia.org/wiki/Søren_克尔凯郭尔 仅供参考,如果您使用Wikipedia API,您将遇到许多对象,如'\\u00f8'Python支持名为unicode escape的编码,这将有

Python能否将Unicode实体转换为Unicode?
ex)\u0639\u0631\u0628\u0649至

我想要完全一样的事情可以做

这将帮助我解析JSON unicode实体以生成有效的URL

ex)'S\\u00f8ren Kierkegaard'->https://en.wikipedia.org/wiki/Søren_克尔凯郭尔


仅供参考,如果您使用Wikipedia API,您将遇到许多对象,如
'\\u00f8'

Python支持名为
unicode escape
的编码,这将有助于:

>>> br'\u0639\u0631\u0628\u0649'.decode('unicode-escape')
'عربى'

Python支持名为
unicode转义的编码,这将有助于:

>>> br'\u0639\u0631\u0628\u0649'.decode('unicode-escape')
'عربى'

当我看到这样的unicode问题时,我真的感到害怕和颤抖:)我已经花了好几个小时来努力解决这个“概念上简单”的问题。我现在感到头晕。你的问题有点不清楚。你有什么类型的绳子?它必须使用
%uxxx
模式吗?你知道如何使用Python的风格来表示事物,难道你不能转换它吗?你为什么不使用
json
模块来解析实体<代码>json.loads(“{”值“:[“\\u0639\\u0631\\u0628\\u0649”]}”)
=>
{value':['值]]
@Mark Tolonen可能是因为我代码中的编程上下文?我必须用“findall”找到实体
wikisource=wikiresponse.read()linkstuple=re.findall('\*\s*(St.)?\s*\[\[([^\]\124;]*)(?=.\]\]\]),wikisource,re.UNICODE)
如果我使用
json
模块解析wikisource,那么我就不能再使用.findall方法了。。它需要字符串而不是dict类型。因此,我尝试了另一种方法,即通过正则表达式获取实体后,再对实体进行解码。当我看到这样的unicode问题时,我真的感到害怕和颤抖:)我花了几个小时的时间与这种“概念上简单”的东西作斗争。我现在感到头晕。你的问题有点不清楚。你有什么类型的绳子?它必须使用
%uxxx
模式吗?你知道如何使用Python的风格来表示事物,难道你不能转换它吗?你为什么不使用
json
模块来解析实体<代码>json.loads(“{”值“:[“\\u0639\\u0631\\u0628\\u0649”]}”)
=>
{value':['值]]
@Mark Tolonen可能是因为我代码中的编程上下文?我必须用“findall”找到实体
wikisource=wikiresponse.read()linkstuple=re.findall('\*\s*(St.)?\s*\[\[([^\]\124;]*)(?=.\]\]\]),wikisource,re.UNICODE)
如果我使用
json
模块解析wikisource,那么我就不能再使用.findall方法了。。它需要字符串而不是dict类型。所以我尝试了另一种方法,也就是,在通过正则表达式获取实体之后,然后解码实体。