Python Scrapy检索的文本编码不正确，希伯来语为\u0d5等_Python_Unicode_Encoding_Scrapy

Python Scrapy检索的文本编码不正确，希伯来语为\u0d5等

python unicode encoding scrapy

Python Scrapy检索的文本编码不正确，希伯来语为\u0d5等,python,unicode,encoding,scrapy,Python,Unicode,Encoding,Scrapy,第一次用这种东西。检查了关于内部化/文本编码的所有其他SOF问题我正在做“刮毛”教程，当我被困在这一部分时：，提取数据时，文本而不是希伯来文显示为一系列\uxxx 例如，你可以通过刮擦来检查它 scrapy shell http://israblog.nana10.co.il/blogread.asp?blog=167524&blogcode=13348970 hxs.select('//h2[@class="title"]/text()').extract()[0] 这将检索

第一次用这种东西。检查了关于内部化/文本编码的所有其他SOF问题

我正在做“刮毛”教程，当我被困在这一部分时：，提取数据时，文本而不是希伯来文显示为一系列\uxxx

例如，你可以通过刮擦来检查它

scrapy shell http://israblog.nana10.co.il/blogread.asp?blog=167524&blogcode=13348970
hxs.select('//h2[@class="title"]/text()').extract()[0]

这将检索

u'\u05de\u05d9\u05d0\u05e0\u05e1\u05e4\u05d5\u05d8\u05e0\u05e6\u05d9\u05d0\u05dc\u05d9？'

（无关：）如果您尝试在控制台中打印它，您会得到：

回溯（最近一次呼叫最后一次）：
文件“”，第1行，在
文件“C:\Python27\lib\encodings\cp437.py”，第12行，在encode中
返回编解码器.charmap\u encode（输入、错误、编码\u映射）
UnicodeEncodeError:“charmap”编解码器无法对位置0-1中的字符进行编码：cha
racter映射到

尝试通过设置设置编码，尝试手动转换，基本上我觉得我尝试了一切

（我已经去了大约5个波莫多洛人试图解决这个问题！）

我能做些什么来获得应该在那里的希伯来文文本：“

מיאספטנצא㪡י？

”

（免责声明：我刚进入我注意到的第一个博客和帖子，我与博客或博客所有者没有任何关系，我只是把它作为一个例子）

您是否尝试过将从页面中获得的信息存储在json、xml等格式的某个地方

我在一些网站上遇到了这些问题，在大多数情况下，若你们不处理检索到的数据，它会被正确地存储，但若你们试图在控制台中打印出来，你们不会得到正确的结果，或者若你们不使用repr，它会给出错误

print repr(data)

我希望这能有所帮助，因为我知道编码问题带来的挫折

我该怎么做才能得到应该在那里的希伯来文文本：“מיאנס” פוטנציא