Python Unicode编码、.txt和阿拉伯语(从右到左)脚本

Python Unicode编码、.txt和阿拉伯语(从右到左)脚本,python,utf-8,Python,Utf 8,我想通过构建一个字典在一个大样本中创建一个单词计数的直方图,然后用它们的计数打印最常见的单词,因此基本上只打印几个键/值对 然而,许多单词不是拉丁字母,所以我做了: try: print key, word_dict[key] except: print key.encode('utf-8'), word_dict[key], 当结果直接打印到命令行界面时,非拉丁字母表的单词是不可读的,但键/值顺序保持不变 但是,当我

我想通过构建一个字典在一个大样本中创建一个单词计数的直方图,然后用它们的计数打印最常见的单词,因此基本上只打印几个键/值对

然而,许多单词不是拉丁字母,所以我做了:

       try: 
           print key, word_dict[key]
       except: 
           print key.encode('utf-8'), word_dict[key],
当结果直接打印到命令行界面时,非拉丁字母表的单词是不可读的,但键/值顺序保持不变

但是,当我将结果打印到.txt文件中时,阿拉伯语单词是可读的,与这些单词对应的键/值对似乎是按相反顺序打印的:value/key。但是,中文字符的顺序是正确的:键/值

所以我想知道.txt是否如此“聪明”,以至于它能识别阿拉伯语并按从右到左的顺序打印?此外,我能做些什么来维持我想要的键/值的顺序

当结果直接打印到命令行界面时 非拉丁字母的单词是不可读的

这可能是因为您的终端/cmd_窗口未设置为
utf-8
,您可以在窗口的设置/首选项中进行更改

但是,当我将结果打印到.txt文件中时,阿拉伯语单词是 可读


打开文本文件的程序有一个设置,告诉它将保存在磁盘上的字节解释为
utf-8

非常感谢,我会安排好的。