通过distinctDay查找值在数据集python中出现的天数
我有一个只有3个特征的数据集。功能包括人物、电影和日期。我想知道一个人看某部电影的不同日期。所以对于每个人,我想计算一下她看过那部电影的天数。如果可能的话,甚至可能在一天中出现多少次,但主要关注的是有多少天通过distinctDay查找值在数据集python中出现的天数,python,pandas,count,distinct,analytics,Python,Pandas,Count,Distinct,Analytics,我有一个只有3个特征的数据集。功能包括人物、电影和日期。我想知道一个人看某部电影的不同日期。所以对于每个人,我想计算一下她看过那部电影的天数。如果可能的话,甚至可能在一天中出现多少次,但主要关注的是有多少天 movie person Day 0 le vie john 2017-09-21 1 friends sa
movie person Day
0 le vie john 2017-09-21
1 friends sarah 2017-09-21
2 giraffe maggie 2017-09-21
3 maome mark 2017-09-21
4 tarzan faby 2017-09-25
5 heaven elisa 2017-09-25
6 moon lucy 2017-09-25
7 king kong philip 2017-09-25
8 la la land hannah 2017-09-25
它持续了数千行。
任何人都有任何想法,我尝试过大多数群比,但我不确定我能从中得到我想要的。谢谢你的帮助。
谢谢,(假设您使用的是熊猫)
像这样的怎么样:
df.groupby(['actor', 'action_query_phone']).Day.nunique()
这将给出每个人观看每部电影的天数(不显示观看时间为0天的条目)如果您发布示例的输出,可能会有所帮助。奇怪的列名是什么?前两个不应该是“电影”和“观众”或类似的东西吗?您使用的是
pandas
?这就是它看起来的样子,但是想要验证。“ts”列的数据类型是什么?字符串?@timgeb抱歉,我的错误谢谢你的回答,我试过了,但它出现了错误:“DataFrameGroupBy”对象没有属性“Tsan”我写了一天,因为我在列名中犯了一个错误,但它会出现错误重试。。。我希望专栏名为ts
使用unique()而不是ununique(),我能够得到演员看同一部电影的时间,但无法得到数字,谢谢。只是一个更正,它应该是nunique()而不是ununique()