文件中未包含字节的Python Unicode解码错误
我正在使用文件中未包含字节的Python Unicode解码错误,python,c++,unicode,Python,C++,Unicode,我正在使用readline()逐行阅读python中的一个大文件。接近672280行后,我得到一个错误: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xfd in position 228: invalid start byte. 但是,我已经使用grep搜索了文件中的一个字节0xfd,结果它没有返回任何字节。我还编写了c++代码来遍历文件并查找一个字节0xfd,但仍然一无所获。所以我不知道这里发生了什么。是否因为文件太大而出错
readline()
逐行阅读python中的一个大文件。接近672280行后,我得到一个错误:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xfd in position 228:
invalid start byte.
但是,我已经使用grep
搜索了文件中的一个字节0xfd
,结果它没有返回任何字节。我还编写了c++
代码来遍历文件并查找一个字节0xfd
,但仍然一无所获。所以我不知道这里发生了什么。是否因为文件太大而出错
我只是不明白一个非文件中的字节怎么会发生解码错误
谢谢您可以尝试使用ISO编码打开文件
open('myfile.txt', encoding = "ISO-8859-1")
您可以尝试使用ISO编码打开文件
open('myfile.txt', encoding = "ISO-8859-1")
可能的重复可能的重复