Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/18.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 在多索引数据帧中,我们是否在级别0上显式地分组和求和?现在我得到的是空数据帧_Python_Python 3.x_Pandas_Dataframe_Multi Index - Fatal编程技术网

Python 在多索引数据帧中,我们是否在级别0上显式地分组和求和?现在我得到的是空数据帧

Python 在多索引数据帧中,我们是否在级别0上显式地分组和求和?现在我得到的是空数据帧,python,python-3.x,pandas,dataframe,multi-index,Python,Python 3.x,Pandas,Dataframe,Multi Index,我正在为一个新概念而挣扎,这是我最近偶然发现的。我正在尝试使用多索引数据帧。我在这个数据框中有两行标题,我真的需要两个标题匹配,就像我从CSV文件导入数据时一样 这是我的多索引DF: index IDRSSD RCFD3531 \ Unnamed: 0_level_1 TRDG ASSETS-US TREAS SECS IN DOM OFF 0 0

我正在为一个新概念而挣扎,这是我最近偶然发现的。我正在尝试使用多索引数据帧。我在这个数据框中有两行标题,我真的需要两个标题匹配,就像我从CSV文件导入数据时一样

这是我的多索引DF:

      index             IDRSSD                             RCFD3531  \
            Unnamed: 0_level_1 TRDG ASSETS-US TREAS SECS IN DOM OFF   
0         0                 37                                  0.0   
1         1                242                                  0.0   
2         2                279                                  0.0   
3         3                354                                  0.0   
4         4                457                                  0.0   
    ...                ...                                  ...   
21380  7080            4232881                                  0.0   
21381  7081            4257594                                  0.0   
21382  7082            4262534                                  0.0   
21383  7083            4262543                                  0.0   
21384  7084            4368351                                  0.0   

                               RCFD3532  ...  \
      TRDG ASSETS-US GOV AGC CORP OBLGS  ...   
0                                   0.0  ...   
1                                   0.0  ...   
2                                   0.0  ...   
3                                   0.0  ...   
4                                   0.0  ...   
                                ...  ...   
21380                               0.0  ...   
21381                               0.0  ...   
21382                               0.0  ...   
21383                               0.0  ...   
21384                               0.0  ...   

                                           file schedule_code        year  \
                                                                            
0      FFIEC CDR Call Schedule RCD 03312011.txt           RCD  03/31/2011   
1      FFIEC CDR Call Schedule RCD 03312011.txt           RCD  03/31/2011   
2      FFIEC CDR Call Schedule RCD 03312011.txt           RCD  03/31/2011   
3      FFIEC CDR Call Schedule RCD 03312011.txt           RCD  03/31/2011   
4      FFIEC CDR Call Schedule RCD 03312011.txt           RCD  03/31/2011   
                                        ...           ...         ...   
21380  FFIEC CDR Call Schedule RCD 03312013.txt           RCD  03/31/2013   
21381  FFIEC CDR Call Schedule RCD 03312013.txt           RCD  03/31/2013   
21382  FFIEC CDR Call Schedule RCD 03312013.txt           RCD  03/31/2013   
21383  FFIEC CDR Call Schedule RCD 03312013.txt           RCD  03/31/2013   
21384  FFIEC CDR Call Schedule RCD 03312013.txt           RCD  03/31/2013   

        qyear  
               
0      2011Q1  
1      2011Q1  
2      2011Q1  
3      2011Q1  
4      2011Q1  
      ...  
21380  2013Q1  
21381  2013Q1  
21382  2013Q1  
21383  2013Q1  
21384  2013Q1  

[21385 rows x 145 columns]
进口是这样做的;我认为这是正确的

df = pd.read_csv(f, delimiter='\t', skiprows=0, header=[0,1])
我认为问题在于我做GroupBy和Sum的方式。下面是我正在测试的代码

grouped_and_summed = df_append.stack().reset_index().groupby(['IDRSSD','qyear']).sum()
我想按这两个字段分组:
'idrsd'、'qyear'
并对所有其他字段求和

当我运行上面的代码并检查
grouped\u和_summated
变量时,我只看到了这一点

Empty DataFrame
Columns: [level_0, RCFD3531, RCFD3532, RCFD3533, RCFD3541, RCFD3543, RCFD3545, RCFD3546, RCFD3547, RCFD3548, RCFDF610, RCFDF614, RCFDF615, RCFDF616, RCFDF618, RCFDF624, RCFDF632, RCFDF633, RCFDF634, RCFDF636, RCFDF639, RCFDF640, RCFDF643, RCFDF644, RCFDF645, RCFDF646, RCFDF647, RCFDF648, RCFDF651, RCFDF652, RCFDF653, RCFDF654, RCFDF655, RCFDF656, RCFDF657, RCFDF658, RCFDF659, RCFDF660, RCFDF790, RCFDG299, RCFDG332, RCFDG333, RCFDG334, RCFDG335, RCFDG379, RCFDG380, RCFDG381, RCFDG383, RCFDG384, RCFDG385, RCFDG386, RCFDG387, RCFDG388, RCFDG651, RCFDG652, RCFDK197, RCFDK198, RCFDK199, RCFDK200, RCFDK210, RCFDK211, RCON3531, RCON3532, RCON3533, RCON3541, RCON3543, RCON3545, RCON3546, RCON3547, RCON3548, RCONF604, RCONF605, RCONF606, RCONF607, RCONF611, RCONF612, RCONF613, RCONF614, RCONF615, RCONF616, RCONF618, RCONF624, RCONF625, RCONF626, RCONF627, RCONF628, RCONF629, RCONF630, RCONF631, RCONF632, RCONF633, RCONF634, RCONF636, RCONF639, RCONF640, RCONF643, RCONF644, RCONF645, RCONF646, RCONF647, ...]
Index: []

[0 rows x 141 columns]
我觉得
'idrsd','qyear'
是在0级,它们被跳过了,但我不确定这是否正确。在
idrsd
下,我有以下内容:
Unnamed:0\u level\u 1
。在CSV文件中,这是完全空白的。在
qyear
下,我还有一个空白。我是否需要将
idrsd
qyear
从0级填充到1级?或者,我是否需要基于级别0执行GroupBy和Sum并跳过级别1?我真的不知道如何处理这种设置

我想我以前有点偏离正轨,但我觉得现在我又回到了正轨。我只需要完成最后一步,把这件事一劳永逸地锁上


最后,我尝试导入这两个标题,然后去掉级别0或级别1,并对这一概念进行了一些处理,但在这方面我没有取得太大的进展,因为我无法在分离这两个标题后轻松地重新组合它们。

请注意,我们更喜欢这里的技术写作风格。我们轻轻地劝阻问候,希望你能帮助,谢谢,提前感谢,感谢信,问候,亲切的问候,签名,请你能帮助,闲聊的材料和缩写的txtspk,恳求,你被困多久了,投票建议,元评论等。只需解释你的问题,并展示你已经尝试了什么,你期望什么,实际上发生了什么。