Pandas 熊猫,分组操作
通过使用Pandas 熊猫,分组操作,pandas,Pandas,通过使用groupby()next output(A、B、C是输入表中的列),我在pandas中找到了 输出详细信息:[244行x 1列]我只想拥有全部3列而不是一列,怎么办 输出,我希望: A B C 0 0 6 0 2 1 . . . 它似乎没有文档记录,但很简单:gb.bfill(),请参见以下示例: In [68]: df=pd.DataFrame({'A':[0,0,0,0,0,0,0,
groupby()
next output(A、B、C是输入表中的列),我在pandas中找到了
输出详细信息:[244行x 1列]
我只想拥有全部3列而不是一列,怎么办
输出,我希望:
A B C
0 0 6
0 2 1
. . .
它似乎没有文档记录,但很简单:
gb.bfill()
,请参见以下示例:
In [68]:
df=pd.DataFrame({'A':[0,0,0,0,0,0,0,0],
'B':[0,0,0,0,1,1,1,1],
'C':[1,2,3,4,1,2,3,4],})
In [69]:
gb=df.groupby(['A', 'B'])
In [70]:
print gb.bfill()
A B C
0 0 0 1
1 0 0 2
2 0 0 3
3 0 0 4
4 0 1 1
5 0 1 2
6 0 1 3
7 0 1 4
[8 rows x 3 columns]
但是我不明白你为什么需要这样做,你不需要以原始的
数据帧
(只可能重新安排)结束吗?感谢并为迟来的回复感到抱歉(假期:-)。我有三列参数,前两列是独立的(例如readers和books),最后一列是指针,用户阅读这本书。有些用户可能会多次阅读某本书,每次尝试保存的内容都是唯一的一行。我所做的是某种排序,我根据唯一值对用户和书籍进行分组,并总结指针的数量。我可以使用函数'groupby(['User','Book']).sum()来完成。不幸的是,我现在只有一列,希望以新的格式返回我的表。事实上,这里描述了我想要的一切:函数as_index=False很重要。非常感谢你!
In [68]:
df=pd.DataFrame({'A':[0,0,0,0,0,0,0,0],
'B':[0,0,0,0,1,1,1,1],
'C':[1,2,3,4,1,2,3,4],})
In [69]:
gb=df.groupby(['A', 'B'])
In [70]:
print gb.bfill()
A B C
0 0 0 1
1 0 0 2
2 0 0 3
3 0 0 4
4 0 1 1
5 0 1 2
6 0 1 3
7 0 1 4
[8 rows x 3 columns]