Python 使用BeautifulSoup编码错误汉字
我正在使用BeautifulSoup从网站中删除数据,但cmd中的汉字显示不正确 它打印\u7b54\u6848\u9808\而不是汉字 这是我的代码: (网站编码为utf-8。)Python 使用BeautifulSoup编码错误汉字,python,python-2.7,beautifulsoup,Python,Python 2.7,Beautifulsoup,我正在使用BeautifulSoup从网站中删除数据,但cmd中的汉字显示不正确 它打印\u7b54\u6848\u9808\而不是汉字 这是我的代码: (网站编码为utf-8。) 我尝试了不同的编码/解码,但总是得到相同的输出。我怎样才能得到正确的汉字?谢谢 在Python2上,您需要对当前输出编码所打印的字符串进行编码 我们不知道您的系统是如何配置的,但是您应该能够找到数百个类似的问题——可能会在您的平台中抛出,以及您在搜索中使用的编码来缩小范围 如果可能的话,我建议改用Python 3。可
我尝试了不同的编码/解码,但总是得到相同的输出。我怎样才能得到正确的汉字?谢谢 在Python2上,您需要对当前输出编码所打印的字符串进行
编码
我们不知道您的系统是如何配置的,但是您应该能够找到数百个类似的问题——可能会在您的平台中抛出,以及您在搜索中使用的编码来缩小范围
如果可能的话,我建议改用Python 3。可能重复的谢谢,我改用Python 3,现在可以看到汉字了。
for item in links:
print (item)
page = urllib2.urlopen(item)
#page.encoding = 'utf8'
page = page.read().decode('utf-8')
soup = BeautifulSoup(page , 'lxml')
divTag = soup.find_all("div", {"class": "t_fsz"})
for tag in divTag:
postData = tag.find_all("td")
print (postData)