Python 在.txt中循环数据时出现规范化错误

Python 在.txt中循环数据时出现规范化错误,python,nlp,Python,Nlp,我正在对以文本格式文件(.TXT)保存的数据进行规范化 代码如下: 将open('C:/Users/User/Desktop/mly.txt',encoding='utf-8')作为f: mylist=[line.rstrip('\n')表示f中的行] 对于mylist中的f: a=规格化器。规格化(f,假设错误=错误) 错误是: ValueError Traceback (most recent calllast) <ipython-input-277-6be23a591fef>

我正在对以文本格式文件(.TXT)保存的数据进行规范化 代码如下:

将open('C:/Users/User/Desktop/mly.txt',encoding='utf-8')作为f:
mylist=[line.rstrip('\n')表示f中的行]
对于mylist中的f:
a=规格化器。规格化(f,假设错误=错误)
错误是:

ValueError Traceback (most recent calllast) <ipython-input-277-6be23a591fef> in <module>
       1 for f in mylist:
 ----> 2     a =  normalizer.normalize(f, assume_wrong = False)

 ~\Anaconda3\lib\site-packages\malaya\normalize.py in normalize(self,
 string, assume_wrong, check_english)
     544                 continue
     545             selected = self._speller.correct(
 --> 546                 word, debug = False, assume_wrong = assume_wrong
     547             )
     548             result.append(result_string + selected + nd_result_string)

 ~\Anaconda3\lib\site-packages\malaya\spell.py in correct(self, word,
 fast, **kwargs)
     296             else:
     297                 word = max(
 --> 298                     self.edit_candidates(word, fast = fast), key = self.P
     299                 )
     300         if len(hujung_result) and not word.endswith(hujung_result):

ValueError: max() arg is an empty sequence
ValueError回溯(最近一次调用)
1表示mylist中的f:
---->2 a=规格化器。规格化(f,假设错误=错误)
normalize(self)中的~\Anaconda3\lib\site packages\malaya\normalize.py,
字符串,假设错误,检查(英语)
544继续
545 selected=self.\u speller.correct(
-->546字,调试=错误,假设错误=假设错误
547             )
548 result.append(result\u string+selected+nd\u result\u string)
~\Anaconda3\lib\site packages\malaya\spell.py格式正确(self,word,
快速,**夸克)
296其他:
297字=最大值(
-->298 self.edit_候选者(word,fast=fast),key=self.P
299                 )
300如果len(hujung_结果)而不是word.endswith(hujung_结果):
ValueError:max()arg是一个空序列

您能更具体地说明什么是规范化器对象吗?不管是什么,我想问题可能是,你传入了一个空字符串。你说的规范化对象是什么意思?我正在规范文本。这回答了您的问题吗?Jindrich的意思是:您的问题在于normalizer对象和normalize方法。我们不知道这是哪一个对象,除非您提供一些代码让我们看看发生了什么,否则我们无法帮助您。看起来您使用的工具并不流行(可能是您自己制作的软件包?)