Python 蟒蛇熊猫-平均得到';雪';每月从每个地点/和#x27;名称';

Python 蟒蛇熊猫-平均得到';雪';每月从每个地点/和#x27;名称';,python,pandas,csv,group-by,datasource,Python,Pandas,Csv,Group By,Datasource,我有一个名为Data.csv的.csv文件。我需要找到每个地点或“名字”每月的平均降雪量。然后,我需要将2016年和2017年的年度总数保存到单独的.csv文件中。我在用熊猫。不知道从哪里开始 这就是我现在通过研究整理的东西 import pandas as pd df2 = pd.read_csv("Data.csv") gname = df2.groupby('NAME') for NAME, Name_df2 in data: df2['DATE'] = pd.to_date

我有一个名为Data.csv的.csv文件。我需要找到每个地点或“名字”每月的平均降雪量。然后,我需要将2016年和2017年的年度总数保存到单独的.csv文件中。我在用熊猫。不知道从哪里开始

这就是我现在通过研究整理的东西

import pandas as pd

df2 = pd.read_csv("Data.csv")

gname = df2.groupby('NAME')

for NAME, Name_df2 in data:
    df2['DATE'] = pd.to_datetime(df2['DATE'])
    df2.groupby([df.DATE.dt.month,'NAME','SNOW']).mean().sort_values()

您需要先向我们提供示例数据。但这是有方向性的:

import pandas as pd

df = pd.read_csv('data.csv')
df['DATE'] = pd.to_datetime(df['DATE'])
g = df.groupby([df.DATE.dt.year, df.DATE.dt.month, 'NAME'])['SNOW'].mean().reset_index().sort_values()

df_2016 = df.loc[df.DATE.dt.year == 2016]
df_2016.to_csv('2016 snow totals.csv', index=False)
df_2017 = df.loc[df.DATE.dt.year == 2017]
df_2017.to_csv('2017 snow totals.csv', index=False)
如果您只有2年以上的时间,您应该将分组的数据框拆分为一个列表,并像..一样迭代

for year in range(df.DATE.dt.year.min(), df.DATE.dt.year.max()):
    df.loc[df.DATE.dt.year == year].to_csv(year + '_snowfall.csv', index=False)

你的问题是什么?是否有错误消息?给我们一些样本数据怎么样?从这里开始,没有什么不对的地方。由于无法访问Data.csv,我会给我们一个示例数据框,因此创建类似于
pd.dataframe({'NAME':['Boston','Boston','New York','New York'],'year':[2016,2017,2017,2016],'totals':[5.6,66,87,55])之类的东西。
。另一件事是,我看不到在哪里定义数据?使用python,我们甚至可以将这7行代码压缩为2行。。(尽我所能……)