python pandas read_csv skiprows不工作

python pandas read_csv skiprows不工作,python,pandas,Python,Pandas,我正在单独读取一个大文件,因为在读取大csv文件时,pd.read_csv通常会导致错误并关闭ipython笔记本中的内核 但是,skiprow函数在我的情况下不起作用 已将熊猫更新至0.20.1的最新版本 但是skiprows功能仍然不起作用 在下面的部分中,我想跳过前两行,只读第二到第六行。但在pd.read_csv中使用skiprows跳过前2行失败 def read(path, header): df= pd.read_csv(path, nrows=6, engine='pyt

我正在单独读取一个大文件,因为在读取大csv文件时,pd.read_csv通常会导致错误并关闭ipython笔记本中的内核

但是,skiprow函数在我的情况下不起作用 已将熊猫更新至0.20.1的最新版本 但是skiprows功能仍然不起作用

在下面的部分中,我想跳过前两行,只读第二到第六行。但在pd.read_csv中使用skiprows跳过前2行失败

def read(path, header):
    df= pd.read_csv(path, nrows=6, engine='python')
    df1= pd.read_csv(path, skiprows=2, nrows=6, engine='python' )
    df.columns= header    

    print df.shape
    print df1.shape
    return df
结果证明是

(6, 26)
(6, 26)
这表明skiprows根本不起作用。。 我在谷歌上搜索过,但没有发现任何人有和我一样的问题。。 我想知道我是否遗漏了导致此问题的一些重要部分

提前谢谢


补充资料:

我的csv文件的前7行:

0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25

20151201000000,b616e9b1f0b488ed2aacf08b6165fc4f76f664aeae46c20c49b7e1e2c81e5f71-ee42bb396f6f56f518c5b04df271c1f173c0bcf13496294464b8d87d3ee17945,(SFC) ウイザードリイ・外伝4 (管理:4366),4988606101009,998,1,17297,2511,2161,16899,16900,16903,,,,,shopping,game_and_toy,video_game,retro_game,super_famicom,software,,,,"

"

20151201000000,b616e9b1f0b488ed2aacf08b6165fc4f76f664aeae46c20c49b7e1e2c81e5f71-ee42bb396f6f56f518c5b04df271c1f173c0bcf13496294464b8d87d3ee17945,(SFC) スーパードラッケン (管理:3701),4906571521028,298,1,17297,2511,2161,16899,16900,16903,,,,,shopping,game_and_toy,video_game,retro_game,super_famicom,software,,,,"

"

20151201000000,b616e9b1f0b488ed2aacf08b6165fc4f76f664aeae46c20c49b7e1e2c81e5f71-ee42bb396f6f56f518c5b04df271c1f173c0bcf13496294464b8d87d3ee17945,(FC) サンダーバード  (管理:9347),4988110900051,498,1,17302,2511,2161,16899,16904,16908,,,,,shopping,game_and_toy,video_game,retro_game,nes,software,,,,"

"

20151201000000,b616e9b1f0b488ed2aacf08b6165fc4f76f664aeae46c20c49b7e1e2c81e5f71-ee42bb396f6f56f518c5b04df271c1f173c0bcf13496294464b8d87d3ee17945,(FC) ガンサイト (管理:8853),4988602564624,198,1,17302,2511,2161,16899,16904,16908,,,,,shopping,game_and_toy,video_game,retro_game,nes,software,,,,"

"


  20151201000000,b616e9b1f0b488ed2aacf08b6165fc4f76f664aeae46c20c49b7e1e2c81e5f71-ee42bb396f6f56f518c5b04df271c1f173c0bcf13496294464b8d87d3ee17945,(SFC) プリンセスメーカー (管理:4201),4904880133802,298,1,17297,2511,2161,16899,16900,16903,,,,,shopping,game_and_toy,video_game,retro_game,super_famicom,software,,,,"

它非常脏,两行中的任何一行都会出现冗余行“,”。

nrows
是从起始偏移量开始的,而不是从文件的开头开始的。您想要
nrows=4

您的文件是什么样子的?您好,我想跳过前两行来阅读3到6行。请添加您的CSV示例file@EdChum你好,我在文章中添加了这些信息。谢谢问题已由@Kyle澄清,问题已结束。谢谢你好,凯尔,在实际操作中,“skiprows=3000001,nrows=6000000”。也没有跳过。@LeighTsai要跳过的实际行数或要读取的行数并不重要。您只需要记住,
read_csv()
将返回
nrows
中指定的行数,而不管
skiprows
是什么。@Kyle感谢您的澄清!现在我知道它是怎么工作的了!