python无法完全读取大文件(1.4 GB)

python无法完全读取大文件(1.4 GB),python,io,Python,Io,我想使用python 2.7.6(32位)读取一个大文件(1.4GB)。 然而,我尝试的解决方案不起作用。例如,如果我运行以下代码: os.system('dir')#给我2014年3月20日16:55 1414 488 081书评 以“打开”(“书评”)作为f: tmp=0 对于f中的行: 打印行 对于直线中的c: tmp+=1 tmp的值为6642 最重要的是,最后一行是 像卡尔霍恩一样,对州权利的支持仍然是一个完整的fa 而对应的行是 Like Calhoun the support f

我想使用python 2.7.6(32位)读取一个大文件(1.4GB)。 然而,我尝试的解决方案不起作用。例如,如果我运行以下代码:

os.system('dir')#给我2014年3月20日16:55 1414 488 081书评
以“打开”(“书评”)作为f:
tmp=0
对于f中的行:
打印行
对于直线中的c:
tmp+=1
tmp
的值为6642

最重要的是,最后一行是

像卡尔霍恩一样,对州权利的支持仍然是一个完整的fa

而对应的行是

Like Calhoun the support for states rights remains a complete fa^Zade. I found Russell Kirk's salesmanship of Conservativism generally repellent but recommend the book because it remains a fairly enlightening view of an ideology that continues to thrive to this day.
除此之外,这是39001831行文件中的第93行

我真的可以用新的眼光看待这个问题,我真的不明白会发生什么

更新
问题显然来自此
^Z
(提问时未发现)。但是,我无法摆脱它(像
line.replace(“^Z”,““”)
)这样的东西是不够的。

我猜缺少的第一个字符是:ç。我猜你的问题与字符编码有关,但事实并非如此(至少在我看来)。最后一个pritned单词是
fa
,而它应该是
faade
。使用vi读取文件时,显示一个离散的
^Z
位于前面两个“a”之间。你知道一种摆脱这种情况的方法吗?这可能有助于从文件中删除EOF字符-确实如此,谢谢。