Python 使用BeautifulSoup编码错误汉字

Python 使用BeautifulSoup编码错误汉字,python,python-2.7,beautifulsoup,Python,Python 2.7,Beautifulsoup,我正在使用BeautifulSoup从网站中删除数据,但cmd中的汉字显示不正确 它打印\u7b54\u6848\u9808\而不是汉字 这是我的代码: (网站编码为utf-8。) 我尝试了不同的编码/解码,但总是得到相同的输出。我怎样才能得到正确的汉字?谢谢 在Python2上,您需要对当前输出编码所打印的字符串进行编码 我们不知道您的系统是如何配置的,但是您应该能够找到数百个类似的问题——可能会在您的平台中抛出,以及您在搜索中使用的编码来缩小范围 如果可能的话,我建议改用Python 3。可

我正在使用BeautifulSoup从网站中删除数据,但cmd中的汉字显示不正确

它打印\u7b54\u6848\u9808\而不是汉字

这是我的代码: (网站编码为utf-8。)


我尝试了不同的编码/解码,但总是得到相同的输出。我怎样才能得到正确的汉字?谢谢

在Python2上,您需要对当前输出编码所打印的字符串进行
编码

我们不知道您的系统是如何配置的,但是您应该能够找到数百个类似的问题——可能会在您的平台中抛出,以及您在搜索中使用的编码来缩小范围


如果可能的话,我建议改用Python 3。

可能重复的谢谢,我改用Python 3,现在可以看到汉字了。
for item in links:
    print (item)
    page = urllib2.urlopen(item)
    #page.encoding = 'utf8'
    page = page.read().decode('utf-8')
    soup = BeautifulSoup(page , 'lxml')

    divTag = soup.find_all("div", {"class": "t_fsz"})
    for tag in divTag:
        postData = tag.find_all("td")
        print (postData)