Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/vue.js/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
阿拉伯语-Python 2.7中的UnicodeDecodeError_Python_Unicode_Utf 8 - Fatal编程技术网

阿拉伯语-Python 2.7中的UnicodeDecodeError

阿拉伯语-Python 2.7中的UnicodeDecodeError,python,unicode,utf-8,Python,Unicode,Utf 8,我编写这段代码是为了用python处理阿拉伯语 import codecs file = codecs.open("C:\Python27\CCA_raw_utf8.txt","r","utf-8") text= file.read() #################################### print "\n "," --------------------------------------------" text=text[1:] words=text.

我编写这段代码是为了用python处理阿拉伯语

 import codecs
 file = codecs.open("C:\Python27\CCA_raw_utf8.txt","r","utf-8")
 text= file.read()
 ####################################

 print "\n "," --------------------------------------------"

 text=text[1:]
 words=text.split()

 for w in words:
    if w == unicode ("الشيخ","utf-8"):
    print w
但它不起作用,并且会产生一个错误:

if w == unicode ("الشيخ","utf-8"):
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc7 in position 0: invalid    continuation byte "

为什么我的程序会给出这个结果,我们如何解决这个问题

可能您的文本编辑器没有以UTF-8存储和显示文本,而是使用了另一种编码。请尝试改用Unicode文本:

if w == u"الشيخ":

如果仍然不起作用,您需要找出编辑器使用的编码,并将其替换为
“utf-8”

,可能您的文本编辑器没有存储和显示utf-8中的文本,而是使用了另一种编码。请尝试改用Unicode文本:

if w == u"الشيخ":

如果仍然不起作用,您需要找出编辑器使用的编码,并将其替换为
“utf-8”

检查以下链接。我认为这对这种情况很有用


检查以下链接。我认为这对这种情况很有用


您可能需要使用支持unicode字符的终端。代码
unicode(“utf-8”)
在osx中工作


尝试使用IDLE或其他IDE/终端。

您可能需要使用支持unicode字符的终端。代码
unicode(“utf-8”)
在osx中工作


尝试使用IDLE或其他IDE/终端。

好奇这里,在我的IDE中,输入中显示
不支持的字符。
好奇这里,在我的IDE中,输入中显示
不支持的字符。@user2913962您只需知道。您使用的是什么操作系统和编辑器?如果是Windows,安装了哪种语言变体?@user2913962在这种情况下,请尝试使用
“Windows-1256”
作为
unicode
@user2913962的参数。您能更具体一些吗?我怀疑是同一个错误。@user2913962您只需要知道。您使用的是什么操作系统和编辑器?如果是Windows,安装了哪种语言变体?@user2913962在这种情况下,请尝试使用
“Windows-1256”
作为
unicode
@user2913962的参数。您能更具体一些吗?我怀疑这是同一个错误。对我来说,这似乎是一个合乎逻辑的解释。谢谢我建议使用Console2,它对外来字符绝对是美妙的(我经常使用它)对我来说似乎是一个合乎逻辑的解释。谢谢我建议使用Console2,它对外国角色绝对是美妙的(我经常使用它)