Python 转换形式为“unicode”\uxxxxxx";字符串或文本

Python 转换形式为“unicode”\uxxxxxx";字符串或文本,python,unicode,python-unicode,unicode-escapes,Python,Unicode,Python Unicode,Unicode Escapes,我正在编写一个python脚本,它将提取facebook视频的url。但是在视频页面的源代码中,我在url中看到了一些\uxxx格式的字符 例如,url就是这种形式 https\u00253A\u00255C\u00252F\u00255C\u00252Ffbcdn-video-a.akamaihd.net\u00255C\u00252Fhvideo-ak-prn2\u00255C\u00252Fv\u00255C\u00252F753002_318048581647953_53890_n.mp

我正在编写一个python脚本,它将提取facebook视频的url。但是在视频页面的源代码中,我在url中看到了一些\uxxx格式的字符

例如,url就是这种形式

https\u00253A\u00255C\u00252F\u00255C\u00252Ffbcdn-video-a.akamaihd.net\u00255C\u00252Fhvideo-ak-prn2\u00255C\u00252Fv\u00255C\u00252F753002_318048581647953_53890_n.mp4\u00253Foh\u00253D64e3e8ecf7e88f1da335d88949b2dc1f\u002526oe\u00253D52226D10\u002526__gda__\u00253D1377987338_9e37fb163a1d37d4b06ab7cff668f7dc\u002522\u00252C\u002522
\u00253A是冒号(:),但如何转换它

我什么时候喜欢的

>>> x.decode('unicode_escape').encode('ascii','ignore')
我明白了

'https%3A%5C%2F%5C%2Ffbcdn-video-a.akamaihd.net%5C%2Fhvideo-ak-prn2%5C%2Fv%5C%2F753002_318048581647953_53890_n.mp4%3Foh%3D64e3e8ecf7e88f1da335d88949b2dc1f%26oe%3D52226D10%26__gda__%3D1377987338_9e37fb163a1d37d4b06ab7cff668f7dc%22%2C%22
我想要准确的网址,而不是百分比

我找了很多,但找不到任何帮助

提前谢谢

编辑

有没有办法,如果我传递整个facebook页面的源代码,然后将所有这些复杂的unicode字符转换为简单的unicode字符

>>> import urllib
>>> s = b'https\u00253A\u00255C\u00252F\u00255C\u00252Ffbcdn-video'
>>> print urllib.unquote_plus(s.decode('unicode_escape'))
https:\/\/fbcdn-video
您的字符串似乎是反斜杠

>>> import re
>>> import urllib
>>> s = b'https\u00253A\u00255C\u00252F\u00255C\u00252Ffbcdn-video'
>>> re.sub(r'\\(.)', r'\1', urllib.unquote_plus(s.decode('unicode_escape')))
u'https://fbcdn-video'

是的,但我想改变它确切的url类型,在python中的任何库中,我都可以在其中传递整个源代码,并将其转换为普通字符串或text@vaibhav1312我不太明白你的问题?把整个源代码放在一个字符串变量中,然后运行我在答案中给出的最后一行。谢谢@viktor。它转换了所有这些内容,这是一个奇怪的双转义字符串。@不仅是url,而且大部分内容都存在于javascript中。例如,检查源代码。按CTRL+F并查找“.mp4”