Python 熊猫,在多个条件下切片多索引df

Python 熊猫,在多个条件下切片多索引df,python,pandas,indexing,slice,object-slicing,Python,Pandas,Indexing,Slice,Object Slicing,这个问题是问题的继续 我想计算最近3个月(2015-12、2015-11、2015-10)的价值总和。如果一只股票没有足够的数据,即没有,在3个月中的1个月或2个月,那么我希望该总和的值为NaN 我可以按和进行分组和求和,但这并没有给出我想要的,因为它可能排除了在这三个月内没有任何数据的股票,然后不考虑有1个月或2个月的股票 我想我需要一个multi-loc语句,但我已经修改过了,还没有得到我想要的结果 df2.loc[idx[:,datetime.date(2015,10,1):datetim

这个问题是问题的继续

我想计算最近3个月(2015-12、2015-11、2015-10)的价值总和。如果一只股票没有足够的数据,即没有,在3个月中的1个月或2个月,那么我希望该总和的值为NaN

我可以按和进行分组和求和,但这并没有给出我想要的,因为它可能排除了在这三个月内没有任何数据的股票,然后不考虑有1个月或2个月的股票

我想我需要一个multi-loc语句,但我已经修改过了,还没有得到我想要的结果

df2.loc[idx[:,datetime.date(2015,10,1):datetime.date(2015,12,1)],:].groupby(level=0).sum()
试试这个:

In [142]: df
Out[142]:
    value       date stock
0       4 2015-01-01  amzn
1       2 2015-02-01  amzn
2       5 2015-03-01  amzn
3       6 2015-04-01  amzn
4       7 2015-05-01  amzn
5       8 2015-06-01  amzn
6       6 2015-07-01  amzn
7       5 2015-08-01  amzn
8       4 2015-09-01  amzn
9       1 2015-10-01  amzn
10      2 2015-11-01  amzn
11      4 2015-12-01  amzn
12      7 2015-12-02  amzn

In [143]: df[(df['date'] >= pd.to_datetime('2015-10-01'))].groupby(df['date'].dt.month).sum()
Out[143]:
      value
date
10        1
11        2
12       11
注意:我故意在您的DF中添加一行,以便至少有一个月的时间包含多行

In [141]: df.loc[12] = [7, pd.to_datetime('2015-12-02'), 'amzn']
更新:

使用以下数据框:

df = pd.DataFrame({
'value' : [4,2,5,6,7,8,6,5,4,1,2,4],
'date': fread_year_month(dt.datetime(2015, 1, 1),dt.datetime(2015, 12, 1)),
'stock': ['amzn']*12
},columns=[
'value', 'date', 'stock'] )

df2 = pd.DataFrame({
'value' : [1]*11,
'date': fread_year_month(dt.datetime(2015, 1, 1),dt.datetime(2015, 11, 1)),
'stock': ['msft']*11
},columns=[
'value', 'date', 'stock'] )

df = df.append(df2)

df.set_index(['stock', 'date'], inplace=True)
我做了以下工作:

In [1]: idx = pd.IndexSlice
​In [2]: criterion = df.loc[idx[:,'2015-10-01':'2015-12-01'],:].\
groupby(level=0).agg(['count']) > 2
In [3]: criterion = criterion['value']['count']
In [4]: df2 = df.loc[idx[:,'2015-10-01':'2015-12-01'],:].groupby(level=0).sum()
​In [5]: df3 = pd.DataFrame(columns=['value'], index=criterion[criterion==False].index)
In [6]: df2[criterion].append(df3, ignore_index=False)

Out[6]:
value
stock   
amzn    7
msft    NaN

在本例中,MSFT没有2015-12年的数据(3个月中只有2个月),因此根据我的要求将其值设置为NaN。

可能会发布一段数据帧,以便我们了解其结构。感谢您的帮助@MaxU。我如何实现这样一个条件:如果一只股票缺少1个月或2个月,那么它们的总和将设置为NaN。