阿拉伯语-Python 2.7中的UnicodeDecodeError
我编写这段代码是为了用python处理阿拉伯语阿拉伯语-Python 2.7中的UnicodeDecodeError,python,unicode,utf-8,Python,Unicode,Utf 8,我编写这段代码是为了用python处理阿拉伯语 import codecs file = codecs.open("C:\Python27\CCA_raw_utf8.txt","r","utf-8") text= file.read() #################################### print "\n "," --------------------------------------------" text=text[1:] words=text.
import codecs
file = codecs.open("C:\Python27\CCA_raw_utf8.txt","r","utf-8")
text= file.read()
####################################
print "\n "," --------------------------------------------"
text=text[1:]
words=text.split()
for w in words:
if w == unicode ("الشيخ","utf-8"):
print w
但它不起作用,并且会产生一个错误:
if w == unicode ("الشيخ","utf-8"):
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc7 in position 0: invalid continuation byte "
为什么我的程序会给出这个结果,我们如何解决这个问题 可能您的文本编辑器没有以UTF-8存储和显示文本,而是使用了另一种编码。请尝试改用Unicode文本:
if w == u"الشيخ":
如果仍然不起作用,您需要找出编辑器使用的编码,并将其替换为
“utf-8”
,可能您的文本编辑器没有存储和显示utf-8中的文本,而是使用了另一种编码。请尝试改用Unicode文本:
if w == u"الشيخ":
如果仍然不起作用,您需要找出编辑器使用的编码,并将其替换为
“utf-8”
检查以下链接。我认为这对这种情况很有用
检查以下链接。我认为这对这种情况很有用
您可能需要使用支持unicode字符的终端。代码
unicode(“utf-8”)
在osx中工作
尝试使用IDLE或其他IDE/终端。您可能需要使用支持unicode字符的终端。代码
unicode(“utf-8”)
在osx中工作
尝试使用IDLE或其他IDE/终端。好奇这里,在我的IDE中,输入中显示
不支持的字符。
好奇这里,在我的IDE中,输入中显示不支持的字符。@user2913962您只需知道。您使用的是什么操作系统和编辑器?如果是Windows,安装了哪种语言变体?@user2913962在这种情况下,请尝试使用“Windows-1256”
作为unicode
@user2913962的参数。您能更具体一些吗?我怀疑是同一个错误。@user2913962您只需要知道。您使用的是什么操作系统和编辑器?如果是Windows,安装了哪种语言变体?@user2913962在这种情况下,请尝试使用“Windows-1256”
作为unicode
@user2913962的参数。您能更具体一些吗?我怀疑这是同一个错误。对我来说,这似乎是一个合乎逻辑的解释。谢谢我建议使用Console2,它对外来字符绝对是美妙的(我经常使用它)对我来说似乎是一个合乎逻辑的解释。谢谢我建议使用Console2,它对外国角色绝对是美妙的(我经常使用它)