Python 如何保留特殊字符，如$，£；从网站中提取文本时？_Python_Scrapy

Python 如何保留特殊字符，如$，£；从网站中提取文本时？

python scrapy

Python 如何保留特殊字符，如$，£；从网站中提取文本时？,python,scrapy,Python,Scrapy,我正在使用scrapy刮取一个示例网站。这是网页-。为了提取数据，我使用xpath选择器。特别是为了获得一本书的价格，我使用下面的xpath-/*[@id=“default”]/div[1]/div/div/div/section/div[2]/ol/li[1]/article/div[2]/p[1]/text（）现在，当我提取价格时，%符号被省略，因为我使用了.get（）。我假设.get（）返回Unicode，从而返回一个字符\u00a3。我阅读了这个问题的答案，但无法理解，因为示例使用了e

我正在使用

scrapy

刮取一个示例网站。这是网页-。为了提取数据，我使用xpath选择器。特别是为了获得一本书的价格，我使用下面的xpath-

/*[@id=“default”]/div[1]/div/div/div/section/div[2]/ol/li[1]/article/div[2]/p[1]/text（）
现在，当我提取价格时，%符号被省略，因为我使用了.get（）
。我假设.get（）
返回Unicode
，从而返回一个字符\u00a3
。我阅读了这个问题的答案，但无法理解，因为示例使用了extract
而不是get
。我还尝试使用注释中提到的.encode（）
，但返回的是空JSON。请告知。
将此内容放在您的spider中的开始URL
下面
custom_settings = { 'FEED_EXPORT_ENCODING' : 'utf-8' } 

JSON不是自动编码为utf-8的，您必须对此进行设置。
您正在抓取的站点是否使用了不同的编码，并且可能声称它使用的是utf-8？你拉下来的实际字节是多少？（可能只是一个小的十六进制转储，在有问题的字符串周围有几个上下文字符就足够了。）另请参见哪个是“这个类似的问题”？请链接？@tripleee编辑了该问题以包含类似的问题。再次，请显示有问题的数据和足够的代码，以查看您如何尝试保存该问题，最好将其简化为一个问题。