Beatiful Soup的编码问题+;python
我一直在阅读关于美丽的汤编码的文章,试图用特殊字符来解析我的html。但是那里的用例与我的不匹配 htmlBeatiful Soup的编码问题+;python,python,parsing,beautifulsoup,Python,Parsing,Beautifulsoup,我一直在阅读关于美丽的汤编码的文章,试图用特殊字符来解析我的html。但是那里的用例与我的不匹配 htmlKimi Räikkönen在作为Kimi RÃikkÃnen刮取后返回,我的应用程序无法处理此问题。当实际标记中包含unicode时(我的标记中没有),文档说明如何转换内容,即Sacr\xc3\xa9 bleu 至圣杯 奇怪的是,当我输入soup.original_encoding时,我总是得到None,即使是正常内容 我已经尝试了文档中的所有示例和其他类似问题,但到目前为止没有一个有效
Kimi Räikkönen
在作为Kimi RÃikkÃnen
刮取后返回,我的应用程序无法处理此问题。当实际标记中包含unicode时(我的标记中没有),文档说明如何转换内容,即Sacr\xc3\xa9 bleu
至圣杯
奇怪的是,当我输入soup.original_encoding
时,我总是得到None
,即使是正常内容
我已经尝试了文档中的所有示例和其他类似问题,但到目前为止没有一个有效。我使用Beatiful Soup作为刮刀和解析器
我非常感谢您对如何处理这一问题的建议。这不是一个很好的问题,而是一个关于
请求的问题
page = requests.get("https://www.formula1.com/en/drivers/kimi-raikkonen.html")
这是我在刮板中的第一行代码,它没有返回正确的编码。此解决方案可能被认为是有问题的,但我只是添加了以下内容来解决此问题:
page.encoding = 'utf-8'