python.readlines（）utf-8/latin-1编码错误_Python_Character Encoding

python.readlines（）utf-8/latin-1编码错误

python character-encoding

python.readlines（）utf-8/latin-1编码错误,python,character-encoding,Python,Character Encoding,我正在写一个程序，把一些hh套件程序粘在一起。。。但我遇到了一个非常奇怪的问题-当脚本必须.readlines（）时，它会依次在一个文件上停止，并出现错误unicodedecodeerror:“utf-8”编解码器无法在适当的位置解码字节0xe2：无效的连续字节”编解码器无法解码字节，因此我将其更改为“latin-1”，结果是相同的我使用'ignore'并省略错误 open('./PFAM/' + seq_file_PFAM_hhr,'r', encoding='UTF-8', errors

我正在写一个程序，把一些hh套件程序粘在一起。。。但我遇到了一个非常奇怪的问题-当脚本必须.readlines（）时，它会依次在一个文件上停止，并出现错误

unicodedecodeerror:“utf-8”编解码器无法在适当的位置解码字节0xe2：无效的连续字节”编解码器无法解码字节

，因此我将其更改为“latin-1”，结果是相同的

我使用'ignore'并省略错误

 open('./PFAM/' + seq_file_PFAM_hhr,'r', encoding='UTF-8', errors='ignore')

但这很烦人，我不知道怎么了。

什么是“hh套房”？文件来自哪里，您希望它包含什么？你知道编码应该是什么吗？你确定这个文件的内容应该代表文本吗？@KarlKnechtel它的生物信息程序套件（）我不知道，但我认为它支持UTF-8或拉丁语-1编码（程序是在德国的Max Plank Instiutein制作的）文件来自程序，只是txt文件。@KarlKnechtel这里：他们的服务器的输出类似吗（在“原始输出”选项卡中）也许我问错了，我能识别编码吗？如果编码错误，会改变它吗？嗯，很奇怪。示例输出看起来像普通的ASCII，无论哪种方式都应该可以，并且“latin-1”应该能够解码任何字节（尽管结果可能不是您想要的）。你能生产出一种新产品吗？例如，选择一个导致问题的文件，并从中删除内容以隔离导致问题的原因。另外，您是否可以显示此代码的上下文（至少在

打开

调用和

读取行

调用之间，并且足以让其他人运行）？通常，创建一个在新文件中读取字符并写入字符的程序非常有用，每个循环一个字符。因此，您可以确切地看到哪里有错误。或者使用

“反斜杠替换”

并查看文件。你应该知道错误是从哪里来的。通常在文件上有一个额外编码的数据集。