json编码为UTF-8字符。如何在Python请求中作为json处理

json编码为UTF-8字符。如何在Python请求中作为json处理,python,json,http,request,Python,Json,Http,Request,我正在抓取一个呈现JavaScript/JSON对象的网站,该对象如下所示: { "company": "\r\n \x3cdiv class=\"page-heading\"\x3e\x3ch1\x3eSEARCH RESULTS 1 - 40 OF 200\x3c/h1\x3e\x3c/div\x3e\r\n\r\n \x3cdiv class=\"right-content-list\"\x3e\r\n\r\n

我正在抓取一个呈现JavaScript/JSON对象的网站,该对象如下所示:

{ "company": "\r\n            \x3cdiv class=\"page-heading\"\x3e\x3ch1\x3eSEARCH
 RESULTS 1 - 40 OF 200\x3c/h1\x3e\x3c/div\x3e\r\n\r\n             
\x3cdiv class=\"right-content-list\"\x3e\r\n\r\n                
\x3cdiv class=\"top-buttons-adm-lft\"\x3e\r\n   
我试图使用Python的请求库将其作为JSON对象(看起来就是这样)处理

我使用以下方法对文本进行编码/处理:

unicodedata.normalize("NFKD", get_city_json.text).encode('utf-8', 'ignore')
unicodedata.normalize("NFKD", get_city_json.text).encode('ascii', 'ignore')
unicode(get_city_json.text)
但是,即使在多次尝试之后,文本仍使用UTF-8编码及其字符呈现。 web应用程序返回的内容类型是
“text/javascript;charset=utf-8”

我希望能够将其作为常规JSON/JavaScript对象进行处理,以便进行解析和读取


非常感谢您的帮助

这不是
UTF-8
。它是HTML编码的文本

您可以使用以下方法对其进行解码:

Python 2 Python 3 如果你用这些来换线,你应该

<div class="page-heading"><h1>SEARCH RESULTS 1 - 40 OF 200</h1></div>
<div class="right-content-list">
<div class="top-buttons-adm-lft">
搜索结果1-40个,共200个

这对我不起作用。我犯了这样的错误<代码>UnicodeEncodeError:“ascii”编解码器无法对33759位置的字符“\xbb”进行编码:序号不在范围(128)这与我给您的代码无关。您需要删除您在问题中发布的
normalize
/
encode
函数。不,我已经删除了这些函数。我正试图直接处理这个问题。尝试打印
unescaped
时抛出错误,我明白了。一些使用较旧Python版本的机器存在此问题。这里有一些解决打印问题的方法:我现在可以打印它,但是HTMLPasser似乎没有回避任何问题。同一代表
import html.parser    
html_parser = html.parser.HTMLParser()
unescaped = html_parser.unescape(json_value)
print unescaped
<div class="page-heading"><h1>SEARCH RESULTS 1 - 40 OF 200</h1></div>
<div class="right-content-list">
<div class="top-buttons-adm-lft">