Python 蟒蛇熊猫-平均得到'；雪'；每月从每个地点/和#x27；名称'；_Python_Pandas_Csv_Group By_Datasource

Python 蟒蛇熊猫-平均得到'；雪'；每月从每个地点/和#x27；名称'；

python pandas csv

Python 蟒蛇熊猫-平均得到'；雪'；每月从每个地点/和#x27；名称'；,python,pandas,csv,group-by,datasource,Python,Pandas,Csv,Group By,Datasource,我有一个名为Data.csv的.csv文件。我需要找到每个地点或“名字”每月的平均降雪量。然后，我需要将2016年和2017年的年度总数保存到单独的.csv文件中。我在用熊猫。不知道从哪里开始这就是我现在通过研究整理的东西 import pandas as pd df2 = pd.read_csv("Data.csv") gname = df2.groupby('NAME') for NAME, Name_df2 in data: df2['DATE'] = pd.to_date

我有一个名为Data.csv的.csv文件。我需要找到每个地点或“名字”每月的平均降雪量。然后，我需要将2016年和2017年的年度总数保存到单独的.csv文件中。我在用熊猫。不知道从哪里开始

这就是我现在通过研究整理的东西

import pandas as pd

df2 = pd.read_csv("Data.csv")

gname = df2.groupby('NAME')

for NAME, Name_df2 in data:
    df2['DATE'] = pd.to_datetime(df2['DATE'])
    df2.groupby([df.DATE.dt.month,'NAME','SNOW']).mean().sort_values()

您需要先向我们提供示例数据。但这是有方向性的：

import pandas as pd

df = pd.read_csv('data.csv')
df['DATE'] = pd.to_datetime(df['DATE'])
g = df.groupby([df.DATE.dt.year, df.DATE.dt.month, 'NAME'])['SNOW'].mean().reset_index().sort_values()

df_2016 = df.loc[df.DATE.dt.year == 2016]
df_2016.to_csv('2016 snow totals.csv', index=False)
df_2017 = df.loc[df.DATE.dt.year == 2017]
df_2017.to_csv('2017 snow totals.csv', index=False)

如果您只有2年以上的时间，您应该将分组的数据框拆分为一个列表，并像..一样迭代

for year in range(df.DATE.dt.year.min(), df.DATE.dt.year.max()):
    df.loc[df.DATE.dt.year == year].to_csv(year + '_snowfall.csv', index=False)

你的问题是什么？是否有错误消息？给我们一些样本数据怎么样？从这里开始，没有什么不对的地方。由于无法访问Data.csv，我会给我们一个示例数据框，因此创建类似于

pd.dataframe（{'NAME'：['Boston'，'Boston'，'New York'，'New York']，'year'：[2016,2017,2017,2016]，'totals'：[5.6,66,87,55]）之类的东西。

。另一件事是，我看不到在哪里定义数据？使用python，我们甚至可以将这7行代码压缩为2行。。（尽我所能……）