Python 在多索引数据帧中,我们是否在级别0上显式地分组和求和?现在我得到的是空数据帧
我正在为一个新概念而挣扎,这是我最近偶然发现的。我正在尝试使用多索引数据帧。我在这个数据框中有两行标题,我真的需要两个标题匹配,就像我从CSV文件导入数据时一样 这是我的多索引DF:Python 在多索引数据帧中,我们是否在级别0上显式地分组和求和?现在我得到的是空数据帧,python,python-3.x,pandas,dataframe,multi-index,Python,Python 3.x,Pandas,Dataframe,Multi Index,我正在为一个新概念而挣扎,这是我最近偶然发现的。我正在尝试使用多索引数据帧。我在这个数据框中有两行标题,我真的需要两个标题匹配,就像我从CSV文件导入数据时一样 这是我的多索引DF: index IDRSSD RCFD3531 \ Unnamed: 0_level_1 TRDG ASSETS-US TREAS SECS IN DOM OFF 0 0
index IDRSSD RCFD3531 \
Unnamed: 0_level_1 TRDG ASSETS-US TREAS SECS IN DOM OFF
0 0 37 0.0
1 1 242 0.0
2 2 279 0.0
3 3 354 0.0
4 4 457 0.0
... ... ...
21380 7080 4232881 0.0
21381 7081 4257594 0.0
21382 7082 4262534 0.0
21383 7083 4262543 0.0
21384 7084 4368351 0.0
RCFD3532 ... \
TRDG ASSETS-US GOV AGC CORP OBLGS ...
0 0.0 ...
1 0.0 ...
2 0.0 ...
3 0.0 ...
4 0.0 ...
... ...
21380 0.0 ...
21381 0.0 ...
21382 0.0 ...
21383 0.0 ...
21384 0.0 ...
file schedule_code year \
0 FFIEC CDR Call Schedule RCD 03312011.txt RCD 03/31/2011
1 FFIEC CDR Call Schedule RCD 03312011.txt RCD 03/31/2011
2 FFIEC CDR Call Schedule RCD 03312011.txt RCD 03/31/2011
3 FFIEC CDR Call Schedule RCD 03312011.txt RCD 03/31/2011
4 FFIEC CDR Call Schedule RCD 03312011.txt RCD 03/31/2011
... ... ...
21380 FFIEC CDR Call Schedule RCD 03312013.txt RCD 03/31/2013
21381 FFIEC CDR Call Schedule RCD 03312013.txt RCD 03/31/2013
21382 FFIEC CDR Call Schedule RCD 03312013.txt RCD 03/31/2013
21383 FFIEC CDR Call Schedule RCD 03312013.txt RCD 03/31/2013
21384 FFIEC CDR Call Schedule RCD 03312013.txt RCD 03/31/2013
qyear
0 2011Q1
1 2011Q1
2 2011Q1
3 2011Q1
4 2011Q1
...
21380 2013Q1
21381 2013Q1
21382 2013Q1
21383 2013Q1
21384 2013Q1
[21385 rows x 145 columns]
进口是这样做的;我认为这是正确的
df = pd.read_csv(f, delimiter='\t', skiprows=0, header=[0,1])
我认为问题在于我做GroupBy和Sum的方式。下面是我正在测试的代码
grouped_and_summed = df_append.stack().reset_index().groupby(['IDRSSD','qyear']).sum()
我想按这两个字段分组:'idrsd'、'qyear'
并对所有其他字段求和
当我运行上面的代码并检查grouped\u和_summated
变量时,我只看到了这一点
Empty DataFrame
Columns: [level_0, RCFD3531, RCFD3532, RCFD3533, RCFD3541, RCFD3543, RCFD3545, RCFD3546, RCFD3547, RCFD3548, RCFDF610, RCFDF614, RCFDF615, RCFDF616, RCFDF618, RCFDF624, RCFDF632, RCFDF633, RCFDF634, RCFDF636, RCFDF639, RCFDF640, RCFDF643, RCFDF644, RCFDF645, RCFDF646, RCFDF647, RCFDF648, RCFDF651, RCFDF652, RCFDF653, RCFDF654, RCFDF655, RCFDF656, RCFDF657, RCFDF658, RCFDF659, RCFDF660, RCFDF790, RCFDG299, RCFDG332, RCFDG333, RCFDG334, RCFDG335, RCFDG379, RCFDG380, RCFDG381, RCFDG383, RCFDG384, RCFDG385, RCFDG386, RCFDG387, RCFDG388, RCFDG651, RCFDG652, RCFDK197, RCFDK198, RCFDK199, RCFDK200, RCFDK210, RCFDK211, RCON3531, RCON3532, RCON3533, RCON3541, RCON3543, RCON3545, RCON3546, RCON3547, RCON3548, RCONF604, RCONF605, RCONF606, RCONF607, RCONF611, RCONF612, RCONF613, RCONF614, RCONF615, RCONF616, RCONF618, RCONF624, RCONF625, RCONF626, RCONF627, RCONF628, RCONF629, RCONF630, RCONF631, RCONF632, RCONF633, RCONF634, RCONF636, RCONF639, RCONF640, RCONF643, RCONF644, RCONF645, RCONF646, RCONF647, ...]
Index: []
[0 rows x 141 columns]
我觉得'idrsd','qyear'
是在0级,它们被跳过了,但我不确定这是否正确。在idrsd
下,我有以下内容:Unnamed:0\u level\u 1
。在CSV文件中,这是完全空白的。在qyear
下,我还有一个空白。我是否需要将idrsd
和qyear
从0级填充到1级?或者,我是否需要基于级别0执行GroupBy和Sum并跳过级别1?我真的不知道如何处理这种设置
我想我以前有点偏离正轨,但我觉得现在我又回到了正轨。我只需要完成最后一步,把这件事一劳永逸地锁上
最后,我尝试导入这两个标题,然后去掉级别0或级别1,并对这一概念进行了一些处理,但在这方面我没有取得太大的进展,因为我无法在分离这两个标题后轻松地重新组合它们。请注意,我们更喜欢这里的技术写作风格。我们轻轻地劝阻问候,希望你能帮助,谢谢,提前感谢,感谢信,问候,亲切的问候,签名,请你能帮助,闲聊的材料和缩写的txtspk,恳求,你被困多久了,投票建议,元评论等。只需解释你的问题,并展示你已经尝试了什么,你期望什么,实际上发生了什么。