Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/laravel/11.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何获取文件中Unicode字符串的频率_Python_Unicode - Fatal编程技术网

Python 如何获取文件中Unicode字符串的频率

Python 如何获取文件中Unicode字符串的频率,python,unicode,Python,Unicode,这是我的密码 计算一个字在文件中出现的次数(所有条目均为Unicode格式) 我的预期结果是 'മാന്നാര്‍' _ 5 മാന്‍ _ 1 我的课文= കുരുവികളോട്‌ കൂട്ട്‌ കൂടാന്‍ … മട്ടാഞ്ചേരി കുരുവികളോടൊത്ത്‌ കൂട്ടുകൂടാനും സംരക്ഷിക്കുവാനും കുരുന്നുമനസ്സുകളില്‍ ബോധമുണര്‍ത്താന്‍ ജെയിന്‍ ഫൗണ്ടേഷന്‍ രംഗത്ത്‌ ലോക കുരുവി

这是我的密码

计算一个字在文件中出现的次数(所有条目均为Unicode格式)

我的预期结果是

'മാന്നാര്‍' _ 5
മാന്‍ _ 1
我的课文=

കുരുവികളോട്‌ കൂട്ട്‌ കൂടാന്‍ …  മട്ടാഞ്ചേരി  കുരുവികളോടൊത്ത്‌ കൂട്ടുകൂടാനും സംരക്ഷിക്കുവാനും കുരുന്നുമനസ്സുകളില്‍ ബോധമുണര്‍ത്താന്‍ ജെയിന്‍ ഫൗണ്ടേഷന്‍ രംഗത്ത്‌  ലോക കുരുവി ദിനമായ ഇന്നലെ കുരുന്നുകള്‍ക്ക്‌ കുരുവിക്കൂടും കുടിവെള്ളപാത്രവും നല്‍കിക്കൊണ്ടാണ്‌ ഫൗണ്ടേഷന്‍ പക്ഷി-മൃഗാദി പരിശീലന പദ്ധതി നടപ്പിലാക്കുന്നത്‌  സ്ക്കൂളുകള്‍  ലൈബ്രറികള്‍ എന്നിവ കേന്ദ്രീകരിച്ചാണ്‌ ഫൗണ്ടേഷന്‍ പദ്ധതി നടപ്പിലാക്കുന്നത്‌  കുരുവികളെ സംരക്ഷിക്കുന്നതിനും  പരിചരിക്കുന്നതിനുമായി പരിസ്ഥിതി സൗഹൃദമായ മണ്‍കുടങ്ങളാണ്‌ ഫൗണ്ടേഷന്‍ സമ്മാനിച്ചത്‌  വേനല്‍കാല ചൂടില്‍ ദാഹമകറ്റുന്നതിന്‌ മണ്‍കലങ്ങളും ഇതിനോടൊപ്പം നല്‍കുകയും ചെയ്തു   
ലോകകുരുവി ദിനത്തില്‍ നടന്ന കുരുവികള്‍ക്ക്‌ കൂടൊരുക്കാം പരിപാടിയില്‍ വിദേശികളും സ്വദേശികളും സാക്ഷികളായി  ഫോര്‍ട്ടുകൊച്ചിയിലെ സെന്റ്‌ മാര്‍ക്കസ്‌ സ്ക്കൂളിലെ കുട്ടികള്‍ക്കാണ്‌ ഫൗണ്ടേഷന്‍ കുരുവിക്കൂടുകള്‍ നല്‍കിയത്‌  ജൈന്‍ ഫൗണ്ടേഷന്‍  ജനമൈത്രി പോലീസ്‌  സെന്റ്മാര്‍ക്കസ്‌ സ്ക്കൂള്‍ എന്നിവരുമായി കൈകോര്‍ത്ത്‌ സംഘടിപ്പിച്ച പരിപാടിയില്‍ ജനമൈത്രി പോലീസ്‌ സി ആര്‍ ഒ  പി യു ഹരിദാസ്‌ സ്ക്കൂള്‍ പ്രിന്‍സിപ്പല്‍ ഹേറിന്‍ ഫെര്‍ണാണ്ടസിന്‌ നല്‍കി പദ്ധതി ഉദ്ഘാടനം ചെയ്തു  ഫൗണ്ടേഷന്‍ ഭാരവാഹി മുകേഷ്‌ ജെയിന്‍ ശാന്തി മേനോന്‍  പ്രിയ കെനറ്റ്‌  എം എം സലീം സുധി എന്നിവര്‍ സംസാരിച്ചു    
但是我越来越

{'\xe0\xb4\xae\xe0\xb4\xbe\xe0\xb4\xa8\xe0\xb5\x8d\xe0\xb4\xa8\xe0\xb4\xbe\xe0\xb4\xb0\xe0\xb5\x8d\xe2\x80\x8d': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'മാന്‍': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]}

这里的错误是什么?

您需要将脚本文件设置为unicode,并且需要python以unicode、utf-8、utf-16格式打开输入文件-无论文件的编码是什么。比如说,

import codecs
f = codecs.open('Mytext.txt', encoding='utf-16')
for line in f:
    print repr(line)

除此之外,您还需要词典将计数的字符串映射到计数,而不是列表,如

Wordlist = {'മാന്നാര്‍':0, 'മാന്‍':0}
当需要增加字典条目时:

Wordlist['മാന്നാര്‍'] += 1

您没有使用Unicode。您使用的是UTF-8编码的字节字符串。您将计数追加到列表中,而不是增加特定单词的计数。。。。您正在对字符串进行迭代,这意味着
将绑定到单个字符。您犯了几个错误,尤其是假设您的输入文件使用与Python源代码相同的编码。“Unicode编码”并没有任何意义。我建议你阅读和打开文件对我来说不是问题,问题是如何提高单词的频率
Wordlist['മാന്നാര്‍'] += 1