python无法完全读取大文件（1.4 GB）_Python_Io

python无法完全读取大文件（1.4 GB）

python io

python无法完全读取大文件（1.4 GB）,python,io,Python,Io,我想使用python 2.7.6（32位）读取一个大文件（1.4GB）。然而，我尝试的解决方案不起作用。例如，如果我运行以下代码： os.system（'dir'）#给我2014年3月20日16:55 1414 488 081书评以“打开”（“书评”）作为f： tmp=0 对于f中的行：打印行对于直线中的c： tmp+=1 tmp的值为6642 最重要的是，最后一行是像卡尔霍恩一样，对州权利的支持仍然是一个完整的fa 而对应的行是 Like Calhoun the support f

我想使用python 2.7.6（32位）读取一个大文件（1.4GB）。然而，我尝试的解决方案不起作用。例如，如果我运行以下代码：

os.system（'dir'）#给我2014年3月20日16:55 1414 488 081书评
以“打开”（“书评”）作为f：
tmp=0
对于f中的行：
打印行
对于直线中的c：
tmp+=1

tmp

的值为6642

最重要的是，最后一行是

像卡尔霍恩一样，对州权利的支持仍然是一个完整的fa

而对应的行是

Like Calhoun the support for states rights remains a complete fa^Zade. I found Russell Kirk's salesmanship of Conservativism generally repellent but recommend the book because it remains a fairly enlightening view of an ideology that continues to thrive to this day.

除此之外，这是39001831行文件中的第93行

我真的可以用新的眼光看待这个问题，我真的不明白会发生什么

更新

问题显然来自此

^Z

（提问时未发现）。但是，我无法摆脱它（像

line.replace（“^Z”，““”）

）这样的东西是不够的。

我猜缺少的第一个字符是：ç。我猜你的问题与字符编码有关，但事实并非如此（至少在我看来）。最后一个pritned单词是

fa

，而它应该是

faade

。使用vi读取文件时，显示一个离散的

^Z

位于前面两个“a”之间。你知道一种摆脱这种情况的方法吗？这可能有助于从文件中删除EOF字符-确实如此，谢谢。