Python 我想使用编解码器操作列_Python

Python 我想使用编解码器操作列

python

Python 我想使用编解码器操作列,python,Python,我试图从压缩文件中提取信息。我使用了以下代码： import codecs !gunzip pagecounts-20150501-000000.gz log = codecs.open('pagecounts-20150501-000000', 'r') lines = log.readlines(1) print(lines) 然而，它只给了我文件中的第一个字母。该文件实际上有4列，但我想使用dataframe或任何其他海量数据结构（几乎186328237行）存储前两列。您只需要第一行中

我试图从压缩文件中提取信息。我使用了以下代码：

import codecs
!gunzip pagecounts-20150501-000000.gz
log = codecs.open('pagecounts-20150501-000000', 'r')
lines = log.readlines(1)
print(lines)

然而，它只给了我文件中的第一个字母。该文件实际上有4列，但我想使用dataframe或任何其他海量数据结构（几乎186328237行）存储前两列。

您只需要第一行中的第一个字符：

lines = log.readlines(1)

您只将“1”传递给

readlines

”-如果您想读取更多，请更改该值，或者可以使用

readline（）

方法一次读取一行

从：

读取行（[sizehint[，keepends]]）读取输入流并将其作为行列表返回

使用编解码器的解码器方法实现行结束，并且如果keepends为true，则包含在列表项中

sizehint（如果给定）作为size参数传递给流的 read（）方法

要阅读第一行，请尝试：

lines = log.readline()

我尝试使用readline（1）而不是readlines（1）：*readline（1）返回文件的第一个字母第一行中有99个字母。NB将1传递给

readline（）

将与

readlines（）相同的大小参数传递给read（）
）

does-阅读文档链接。你最终找到了问题的解决方案吗？这个答案有用吗？如果有用，请随意接受。如果你发现了一个不同的解决方案，请自己发布/接受，以帮助将来遇到类似问题的其他人。