Python 2.7 熊猫提取每日数据并写入csv
我有一个熊猫数据框,看起来像这样:Python 2.7 熊猫提取每日数据并写入csv,python-2.7,pandas,Python 2.7,Pandas,我有一个熊猫数据框,看起来像这样: Index Stat value1 value2 value3 value4 value5 value6 2016-11-01 00:00:00.000 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642 2016-11-01 00:00:00.100 Gard 0.08 0.24 0.09 6.08 1
Index Stat value1 value2 value3 value4 value5 value6
2016-11-01 00:00:00.000 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-01 00:00:00.100 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-01 00:00:00.200 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-01 00:00:00.300 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-01 00:00:00.400 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-02 00:00:00.000 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-02 00:00:00.100 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-02 00:00:00.200 Gard 0.15 0.25 0.01 6.08 31.0 0.291719042916
2016-11-02 00:00:00.300 Gard 0.15 0.25 0.01 6.08 31.0 0.291719042916
Index Stat value1 value2 value3 value4 value5 value6
2016-11-01 00:00:00.000 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-01 00:00:00.100 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-01 00:00:00.200 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-01 00:00:00.300 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-01 00:00:00.400 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
当然,这只是一个片段,整个数据帧大约有430万行
我想提取与日期相关的每一行。因此,将时间戳日期为2016-11-01的所有行放入一个文件中,并将2016-1-02放入另一个文件中。两个文件如下所示:
Index Stat value1 value2 value3 value4 value5 value6
2016-11-01 00:00:00.000 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-01 00:00:00.100 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-01 00:00:00.200 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-01 00:00:00.300 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-01 00:00:00.400 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-02 00:00:00.000 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-02 00:00:00.100 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-02 00:00:00.200 Gard 0.15 0.25 0.01 6.08 31.0 0.291719042916
2016-11-02 00:00:00.300 Gard 0.15 0.25 0.01 6.08 31.0 0.291719042916
Index Stat value1 value2 value3 value4 value5 value6
2016-11-01 00:00:00.000 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-01 00:00:00.100 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-01 00:00:00.200 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-01 00:00:00.300 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
2016-11-01 00:00:00.400 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642
以及:
我尝试在以下命令中使用groupby
:
grouped_df = df.groupby(df.index.date)["Stat","value1","value2","value3","value4","value5","value6"]
但我没有得到任何输出或错误。它运行,但什么也没发生。我做错什么了吗?这是正确的功能吗?还是有更简单、更好的方法?我认为您需要使用应用和以下自定义功能:
x.name
就是保存数据的路径吗?给我一些时间;)但是x.name是不带记录路径的文件名,groupby
返回一个groupby
对象,您可以在该对象上应用sum、mean甚至自定义函数等函数。这就解释了为什么运行groupby
命令时没有得到任何结果。谢谢你的解释!