Python 我想使用编解码器操作列
我试图从压缩文件中提取信息。 我使用了以下代码:Python 我想使用编解码器操作列,python,Python,我试图从压缩文件中提取信息。 我使用了以下代码: import codecs !gunzip pagecounts-20150501-000000.gz log = codecs.open('pagecounts-20150501-000000', 'r') lines = log.readlines(1) print(lines) 然而,它只给了我文件中的第一个字母。该文件实际上有4列,但我想使用dataframe或任何其他海量数据结构(几乎186328237行)存储前两列。您只需要第一行中
import codecs
!gunzip pagecounts-20150501-000000.gz
log = codecs.open('pagecounts-20150501-000000', 'r')
lines = log.readlines(1)
print(lines)
然而,它只给了我文件中的第一个字母。该文件实际上有4列,但我想使用dataframe或任何其他海量数据结构(几乎186328237行)存储前两列。您只需要第一行中的第一个字符:
lines = log.readlines(1)
您只将“1”传递给readlines
”-如果您想读取更多,请更改该值,或者可以使用readline()
方法一次读取一行
从:
读取行([sizehint[,keepends]])读取
输入流并将其作为行列表返回
使用编解码器的解码器方法实现行结束,并且
如果keepends为true,则包含在列表项中
sizehint(如果给定)作为size参数传递给流的
read()方法
要阅读第一行,请尝试:
lines = log.readline()
我尝试使用readline(1)而不是readlines(1):*readline(1)返回文件的第一个字母第一行中有99个字母。NB将1传递给
readline()
将与readlines()相同的大小参数传递给read()
)
does-阅读文档链接。你最终找到了问题的解决方案吗?这个答案有用吗?如果有用,请随意接受。如果你发现了一个不同的解决方案,请自己发布/接受,以帮助将来遇到类似问题的其他人。