Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/305.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
用python 2.7打印阿拉伯语单词和列表_Python_Unicode_Nltk_Arabic - Fatal编程技术网

用python 2.7打印阿拉伯语单词和列表

用python 2.7打印阿拉伯语单词和列表,python,unicode,nltk,arabic,Python,Unicode,Nltk,Arabic,我正在使用anaconda Python 2.7进行阿拉伯语文本分类 当我打印单词或列表或单词时,它以Unicode显示 我想打印真正的阿拉伯语单词 列表contian[阿拉伯语句子,标签] 文档[0] 输出 [[u'\u0631\u0626\u064a\u0633'], u'\u0627\u0644\u0628\u0631\u0644\u0645\u0627\u0646',…],'Politic'] 不经意间,我认为这是因为Python 2.7是在ASCII焦点下编写的(因此,str(u'\u

我正在使用anaconda Python 2.7进行阿拉伯语文本分类 当我打印单词或列表或单词时,它以Unicode显示 我想打印真正的阿拉伯语单词 列表contian[阿拉伯语句子,标签]

文档[0]

输出

[[u'\u0631\u0626\u064a\u0633'], u'\u0627\u0644\u0628\u0631\u0644\u0645\u0627\u0646',…],'Politic']


不经意间,我认为这是因为Python 2.7是在ASCII焦点下编写的(因此,
str(u'\u0631'))
产生一个
UnicodeEncodeError
,因为ASCII中没有字符。
print u'\u0631'
可能有效,因为它只是将unicode直接发送到控制台,控制台配备有处理unicode呈现的功能。

这是Python 2在打印列表时的工作方式。打印单个字符串或更新o Python 3:

>>> print(ascii(s))
[['\u0631\u0626\u064a\u0633', '\u0627\u0644\u0628\u0631\u0644\u0645\u0627\u0646'], 'Politic']
Python 2

>>> s = [[u'\u0631\u0626\u064a\u0633', u'\u0627\u0644\u0628\u0631\u0644\u0645\u0627\u0646'], 'Politic']
>>> print s
[[u'\u0631\u0626\u064a\u0633', u'\u0627\u0644\u0628\u0631\u0644\u0645\u0627\u0646'], 'Politic']
>>> print s[0][0]
رئيس
>>> print s[0][1]
البرلمان
Python 3

>>> s = [[u'\u0631\u0626\u064a\u0633', u'\u0627\u0644\u0628\u0631\u0644\u0645\u0627\u0646'], 'Politic']
>>> print(s)
[['رئيس', 'البرلمان'], 'Politic']
>>> print(s[0][0])
رئيس
>>> print(s[0][1])
البرلمان
在Python 3中,使用
ascii()
可以获得旧的行为:

>>> print(ascii(s))
[['\u0631\u0626\u064a\u0633', '\u0627\u0644\u0628\u0631\u0644\u0645\u0627\u0646'], 'Politic']

您是否尝试了
print
?是的,print会给出相同的结果是否您的控制台不支持unicode?什么是
print u'\u0631'
返回?是
还是
u'\u0631'
?它只支持一个阿拉伯语句子。print!\