Python中的Count和groupby
我创建了下面的代码,它计算一个人(通过他们的登录id)在一年内登录程序的次数Python中的Count和groupby,python,count,group-by,Python,Count,Group By,我创建了下面的代码,它计算一个人(通过他们的登录id)在一年内登录程序的次数 data1.query("'2015-12-01' <= login_date <= '2016-12-01'").groupby(['employer_key','account_id']).size().reset_index().groupby(['employer_key','account_id'])[[0]].count() 我想计算每个独立雇主密钥的帐户ID数量,以便确定一年内每个雇主登录的
data1.query("'2015-12-01' <= login_date <= '2016-12-01'").groupby(['employer_key','account_id']).size().reset_index().groupby(['employer_key','account_id'])[[0]].count()
我想计算每个独立雇主密钥的帐户ID数量,以便确定一年内每个雇主登录的帐户数量
data1.query("'2015-12-01' <= login_date <= '2016-12-01'").groupby(['employer_key','account_id']).size().reset_index().groupby(['employer_key','account_id'])[[0]].count()
希望输出结果如下所示:
employer_key account_id # times logged in
Apple X1 1
Google Y5 2
Facebook X3 4
Apple X2 2
Facebook Y2 1
employer_key user_logins
Apple 2
Google 1
Facebook 2
我想这应该行得通:
data.groupby(['employer_key','account_id']).count().\
unstack().sum(axis=1).astype(int)
#employer_key
#Apple 2
#Facebook 2
#Google 1
#dtype: int64
有多少个独特的帐户?在我的实际数据集中,我有数千个。不,我的问题是,如果你想计算每个雇主的独特用户。我认为您的数据在该列中可能只有唯一的
帐户id
,因此这可能是一个没有意义的问题。哦,对不起。是的,所有帐户ID都是唯一的。您提供的代码中如何考虑我的上述代码?当我运行代码时,它会返回所有日期的数据,而不是我指定的一年期间的数据。我不知道如何将一年期集成到代码中。谢谢我的答案适用于您的代码输出,如第一个输出块所示。连接这两个代码的具体部分是什么?非常感谢你的帮助,我真的很感激。