Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/293.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 大熊猫的递增计数_Python_Pandas - Fatal编程技术网

Python 大熊猫的递增计数

Python 大熊猫的递增计数,python,pandas,Python,Pandas,我的数据集如下。并希望通过C1获得C2组的计数,如下所示 C1 C2 a 1 a 2 a 3 a 4 a 5 b 1 b 2 b 3 b 4 b 5 b 6 c 6 c 7 预期结果如下。b的计数应为a中不存在的项目。与c相同,即a或b a 5 b 1 c 1 有没有什么逻辑我可以用熊猫得到这个。除了遍历记录之外,您还可以删除'C2'列上的重复项,并计算'C1'上留下的值: print(df.drop_duplicates('

我的数据集如下。并希望通过C1获得C2组的计数,如下所示

C1  C2
a   1
a   2
a   3
a   4
a   5
b   1
b   2
b   3
b   4
b   5
b   6
c   6
c   7
预期结果如下。b的计数应为a中不存在的项目。与c相同,即ab

a   5
b   1
c   1

有没有什么逻辑我可以用熊猫得到这个。除了遍历记录之外,您还可以删除
'C2'
列上的重复项,并计算
'C1'
上留下的值:

print(df.drop_duplicates('C2')['C1'].value_counts())
#  a    5
#  b    1
#  c    1
#  Name: C1, dtype: int64
输出将是一个系列。如果需要数据帧,您可以使用
创建数据帧

df = df.drop_duplicates('C2')['C1'].value_counts().to_frame()
print(df)
#     C1
#  a   5
#  b   1
#  c   1
警告

  • 默认情况下,
    value\u计数
    对输出进行排序。在这种情况下,这没有什么区别,但是您可以传递
    sort=False
    ,这样行(索引)将保持与原始数据帧中相同的顺序

这真是太可怕了!!。我能再问一个问题吗?如何获得每个C1的独占C2s计数?。在上面的例子中,a-0,b-0,c-1