Python中的lxml:Scraping仅显示英文字符(其他字符为乱码)
这是我的密码:Python中的lxml:Scraping仅显示英文字符(其他字符为乱码),python,python-3.x,encoding,lxml.html,Python,Python 3.x,Encoding,Lxml.html,这是我的密码: import requests from lxml.etree import HTML title_req = requests.get("https://www.youtube.com/watch?v=VK3QWm7jvZs") title_main = HTML(title_req.content) title = title_main.xpath("//span[@id='eow-title']/@title")[0] print(title) >> Halse
import requests
from lxml.etree import HTML
title_req = requests.get("https://www.youtube.com/watch?v=VK3QWm7jvZs")
title_main = HTML(title_req.content)
title = title_main.xpath("//span[@id='eow-title']/@title")[0]
print(title)
>> Halsey - Without Me - Ù\x85ترجÙ\x85Ø© عربÙ\x8a
我希望它是这样的:
>> Halsey - Without Me - مترجمة عربي
我试图添加UTF-8编码,但它不起作用
谢谢。我不知道为什么,但这一行造成了问题
title_main = HTML(title_req.content)
换成
title_main = HTML(title_req.text)
我将尝试了解原因。可能重复的问题不是同一个问题,如果解决方案相同,即使问题描述不同,thxA问题也可以标记为重复。如果另一个问题的其中一个解决方案解决了问题,则该问题被视为重复问题。我尝试了主题u中的解决方案,说可能重复,但它不起作用,因为问题来自lxml,而不是utf-8您使用的是什么控制台。cmd、bash、powershell?在Windows 10上的Python 3.5.2上,我收到以下错误消息:“UnicodeEncodeError:'charmap'编解码器无法对位置22-27中的字符进行编码:字符映射到”。您使用的是Python 3的哪个特定版本?r.text是unicode格式的响应内容,r.content是字节格式的响应内容。Python 3.6.3 64位visual studio代码及其代码