Python Scrapy检索的文本编码不正确,希伯来语为\u0d5等

Python Scrapy检索的文本编码不正确,希伯来语为\u0d5等,python,unicode,encoding,scrapy,Python,Unicode,Encoding,Scrapy,第一次用这种东西。 检查了关于内部化/文本编码的所有其他SOF问题 我正在做“刮毛”教程,当我被困在这一部分时:, 提取数据时,文本而不是希伯来文显示为一系列\uxxx 例如,你可以通过刮擦来检查它 scrapy shell http://israblog.nana10.co.il/blogread.asp?blog=167524&blogcode=13348970 hxs.select('//h2[@class="title"]/text()').extract()[0] 这将检索

第一次用这种东西。 检查了关于内部化/文本编码的所有其他SOF问题

我正在做“刮毛”教程,当我被困在这一部分时:, 提取数据时,文本而不是希伯来文显示为一系列\uxxx

例如,你可以通过刮擦来检查它

scrapy shell http://israblog.nana10.co.il/blogread.asp?blog=167524&blogcode=13348970
hxs.select('//h2[@class="title"]/text()').extract()[0]
这将检索

u'\u05de\u05d9\u05d0\u05e0\u05e1\u05e4\u05d5\u05d8\u05e0\u05e6\u05d9\u05d0\u05dc\u05d9?'

(无关:)如果您尝试在控制台中打印它,您会得到:
回溯(最近一次呼叫最后一次):
文件“”,第1行,在
文件“C:\Python27\lib\encodings\cp437.py”,第12行,在encode中
返回编解码器.charmap\u encode(输入、错误、编码\u映射)
UnicodeEncodeError:“charmap”编解码器无法对位置0-1中的字符进行编码:cha
racter映射到

尝试通过设置设置编码,尝试手动转换,基本上我觉得我尝试了一切

(我已经去了大约5个波莫多洛人试图解决这个问题!)

我能做些什么来获得应该在那里的希伯来文文本:“
מיאספטנצא㪡י?


(免责声明:我刚进入我注意到的第一个博客和帖子,我与博客或博客所有者没有任何关系,我只是把它作为一个例子)

您是否尝试过将从页面中获得的信息存储在json、xml等格式的某个地方

我在一些网站上遇到了这些问题,在大多数情况下,若你们不处理检索到的数据,它会被正确地存储,但若你们试图在控制台中打印出来,你们不会得到正确的结果,或者若你们不使用repr,它会给出错误

print repr(data)
我希望这能有所帮助,因为我知道编码问题带来的挫折

我该怎么做才能得到应该在那里的希伯来文文本:“מיאנס” פוטנציא