Python 2.7 熊猫提取每日数据并写入csv_Python 2.7_Pandas

Python 2.7 熊猫提取每日数据并写入csv

python-2.7 pandas

Python 2.7 熊猫提取每日数据并写入csv,python-2.7,pandas,Python 2.7,Pandas,我有一个熊猫数据框，看起来像这样： Index Stat value1 value2 value3 value4 value5 value6 2016-11-01 00:00:00.000 Gard 0.08 0.24 0.09 6.08 18.4 0.268514431642 2016-11-01 00:00:00.100 Gard 0.08 0.24 0.09 6.08 1

我有一个熊猫数据框，看起来像这样：

Index                   Stat    value1  value2  value3  value4  value5  value6 
2016-11-01 00:00:00.000 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-01 00:00:00.100 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-01 00:00:00.200 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-01 00:00:00.300 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-01 00:00:00.400 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-02 00:00:00.000 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-02 00:00:00.100 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-02 00:00:00.200 Gard    0.15    0.25    0.01    6.08    31.0    0.291719042916
2016-11-02 00:00:00.300 Gard    0.15    0.25    0.01    6.08    31.0    0.291719042916

Index                   Stat    value1  value2  value3  value4  value5  value6
2016-11-01 00:00:00.000 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-01 00:00:00.100 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-01 00:00:00.200 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-01 00:00:00.300 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-01 00:00:00.400 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642

当然，这只是一个片段，整个数据帧大约有430万行

我想提取与日期相关的每一行。因此，将时间戳日期为2016-11-01的所有行放入一个文件中，并将2016-1-02放入另一个文件中。两个文件如下所示：

Index                   Stat    value1  value2  value3  value4  value5  value6 
2016-11-01 00:00:00.000 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-01 00:00:00.100 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-01 00:00:00.200 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-01 00:00:00.300 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-01 00:00:00.400 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-02 00:00:00.000 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-02 00:00:00.100 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-02 00:00:00.200 Gard    0.15    0.25    0.01    6.08    31.0    0.291719042916
2016-11-02 00:00:00.300 Gard    0.15    0.25    0.01    6.08    31.0    0.291719042916

Index                   Stat    value1  value2  value3  value4  value5  value6
2016-11-01 00:00:00.000 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-01 00:00:00.100 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-01 00:00:00.200 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-01 00:00:00.300 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642
2016-11-01 00:00:00.400 Gard    0.08    0.24    0.09    6.08    18.4    0.268514431642

以及：

我尝试在以下命令中使用

groupby

：

grouped_df = df.groupby(df.index.date)["Stat","value1","value2","value3","value4","value5","value6"]

但我没有得到任何输出或错误。它运行，但什么也没发生。我做错什么了吗？这是正确的功能吗？还是有更简单、更好的方法？

我认为您需要使用

应用和以下自定义功能：
x.name
就是保存数据的路径吗？给我一些时间；）但是x.name是不带记录路径的文件名，groupby
返回一个groupby
对象，您可以在该对象上应用sum、mean甚至自定义函数等函数。这就解释了为什么运行groupby
命令时没有得到任何结果。谢谢你的解释！