python.readlines()utf-8/latin-1编码错误

python.readlines()utf-8/latin-1编码错误,python,character-encoding,Python,Character Encoding,我正在写一个程序,把一些hh套件程序粘在一起。。。但我遇到了一个非常奇怪的问题-当脚本必须.readlines()时,它会依次在一个文件上停止,并出现错误unicodedecodeerror:“utf-8”编解码器无法在适当的位置解码字节0xe2:无效的连续字节”编解码器无法解码字节,因此我将其更改为“latin-1”,结果是相同的 我使用'ignore'并省略错误 open('./PFAM/' + seq_file_PFAM_hhr,'r', encoding='UTF-8', errors

我正在写一个程序,把一些hh套件程序粘在一起。。。但我遇到了一个非常奇怪的问题-当脚本必须.readlines()时,它会依次在一个文件上停止,并出现错误
unicodedecodeerror:“utf-8”编解码器无法在适当的位置解码字节0xe2:无效的连续字节”编解码器无法解码字节
,因此我将其更改为“latin-1”,结果是相同的

我使用'ignore'并省略错误

 open('./PFAM/' + seq_file_PFAM_hhr,'r', encoding='UTF-8', errors='ignore')

但这很烦人,我不知道怎么了。

什么是“hh套房”?文件来自哪里,您希望它包含什么?你知道编码应该是什么吗?你确定这个文件的内容应该代表文本吗?@KarlKnechtel它的生物信息程序套件()我不知道,但我认为它支持UTF-8或拉丁语-1编码(程序是在德国的Max Plank Instiutein制作的)文件来自程序,只是txt文件。@KarlKnechtel这里:他们的服务器的输出类似吗(在“原始输出”选项卡中)也许我问错了,我能识别编码吗?如果编码错误,会改变它吗?嗯,很奇怪。示例输出看起来像普通的ASCII,无论哪种方式都应该可以,并且“latin-1”应该能够解码任何字节(尽管结果可能不是您想要的)。你能生产出一种新产品吗?例如,选择一个导致问题的文件,并从中删除内容以隔离导致问题的原因。另外,您是否可以显示此代码的上下文(至少在
打开
调用和
读取行
调用之间,并且足以让其他人运行)?通常,创建一个在新文件中读取字符并写入字符的程序非常有用,每个循环一个字符。因此,您可以确切地看到哪里有错误。或者使用
“反斜杠替换”
并查看文件。你应该知道错误是从哪里来的。通常在文件上有一个额外编码的数据集。