Python 如何保留特殊字符,如$,£;从网站中提取文本时?

Python 如何保留特殊字符,如$,£;从网站中提取文本时?,python,scrapy,Python,Scrapy,我正在使用scrapy刮取一个示例网站。这是网页-。为了提取数据,我使用xpath选择器。特别是为了获得一本书的价格,我使用下面的xpath-/*[@id=“default”]/div[1]/div/div/div/section/div[2]/ol/li[1]/article/div[2]/p[1]/text() 现在,当我提取价格时,%符号被省略,因为我使用了.get()。我假设.get()返回Unicode,从而返回一个字符\u00a3。我阅读了这个问题的答案,但无法理解,因为示例使用了e

我正在使用
scrapy
刮取一个示例网站。这是网页-。为了提取数据,我使用xpath选择器。特别是为了获得一本书的价格,我使用下面的xpath-
/*[@id=“default”]/div[1]/div/div/div/section/div[2]/ol/li[1]/article/div[2]/p[1]/text()


现在,当我提取价格时,%符号被省略,因为我使用了
.get()
。我假设
.get()
返回
Unicode
,从而返回一个字符
\u00a3
。我阅读了这个问题的答案,但无法理解,因为示例使用了
extract
而不是
get
。我还尝试使用注释中提到的
.encode()
,但返回的是空JSON。请告知。

将此内容放在您的spider中的
开始URL
下面

custom_settings = { 'FEED_EXPORT_ENCODING' : 'utf-8' } 

JSON不是自动编码为utf-8的,您必须对此进行设置。

您正在抓取的站点是否使用了不同的编码,并且可能声称它使用的是utf-8?你拉下来的实际字节是多少?(可能只是一个小的十六进制转储,在有问题的字符串周围有几个上下文字符就足够了。)另请参见哪个是“这个类似的问题”?请链接?@tripleee编辑了该问题以包含类似的问题。再次,请显示有问题的数据和足够的代码,以查看您如何尝试保存该问题,最好将其简化为一个问题。