Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/291.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
通过distinctDay查找值在数据集python中出现的天数_Python_Pandas_Count_Distinct_Analytics - Fatal编程技术网

通过distinctDay查找值在数据集python中出现的天数

通过distinctDay查找值在数据集python中出现的天数,python,pandas,count,distinct,analytics,Python,Pandas,Count,Distinct,Analytics,我有一个只有3个特征的数据集。功能包括人物、电影和日期。我想知道一个人看某部电影的不同日期。所以对于每个人,我想计算一下她看过那部电影的天数。如果可能的话,甚至可能在一天中出现多少次,但主要关注的是有多少天 movie person Day 0 le vie john 2017-09-21 1 friends sa

我有一个只有3个特征的数据集。功能包括人物、电影和日期。我想知道一个人看某部电影的不同日期。所以对于每个人,我想计算一下她看过那部电影的天数。如果可能的话,甚至可能在一天中出现多少次,但主要关注的是有多少天

                    movie          person         Day
0                  le vie            john  2017-09-21
1                 friends           sarah  2017-09-21
2                 giraffe          maggie  2017-09-21
3                   maome            mark  2017-09-21
4                  tarzan            faby  2017-09-25
5                  heaven           elisa  2017-09-25
6                    moon            lucy  2017-09-25
7               king kong          philip  2017-09-25
8              la la land          hannah  2017-09-25
它持续了数千行。 任何人都有任何想法,我尝试过大多数群比,但我不确定我能从中得到我想要的。谢谢你的帮助。 谢谢,

(假设您使用的是熊猫)

像这样的怎么样:

df.groupby(['actor', 'action_query_phone']).Day.nunique()

这将给出每个人观看每部电影的天数(不显示观看时间为0天的条目)

如果您发布示例的输出,可能会有所帮助。奇怪的列名是什么?前两个不应该是“电影”和“观众”或类似的东西吗?您使用的是
pandas
?这就是它看起来的样子,但是想要验证。“ts”列的数据类型是什么?字符串?@timgeb抱歉,我的错误谢谢你的回答,我试过了,但它出现了错误:“DataFrameGroupBy”对象没有属性“Tsan”我写了一天,因为我在列名中犯了一个错误,但它会出现错误重试。。。我希望专栏名为
ts
使用unique()而不是ununique(),我能够得到演员看同一部电影的时间,但无法得到数字,谢谢。只是一个更正,它应该是nunique()而不是ununique()