Pandas 按&;分组后保留所有列;创建一个新的数据帧

Pandas 按&;分组后保留所有列;创建一个新的数据帧,pandas,dataframe,Pandas,Dataframe,我一直在努力解决这项任务 我有一个csv如下,加载到熊猫df。(对不起,伙计们,我不知道如何设置Jupyter输出的格式以便在这里发布:(关于格式的任何建议也值得一提)这代表一名员工的出勤率 direction date time departure 2018-02-14 15:48:27 departure 2018-09-10 13:22:05 arrival 2019-03-11 15:45:49 arrival 2019-09-27 09:45:52 arriv

我一直在努力解决这项任务

我有一个csv如下,加载到熊猫df。(对不起,伙计们,我不知道如何设置Jupyter输出的格式以便在这里发布:(关于格式的任何建议也值得一提)这代表一名员工的出勤率

direction   date    time
departure   2018-02-14  15:48:27
departure   2018-09-10  13:22:05
arrival 2019-03-11  15:45:49
arrival 2019-09-27  09:45:52
arrival 2019-04-04  11:16:08
arrival 2019-01-22  15:56:46
departure   2019-11-06  13:12:12
arrival 2019-05-07  14:35:47
arrival 2018-08-28  16:13:10
arrival 2020-10-06  11:27:23
departure   2020-07-09  16:45:59
arrival 2020-10-26  16:06:30
arrival 2018-07-16  11:07:30
arrival 2019-04-16  15:52:33
departure   2019-03-20  16:19:15
arrival 2019-05-30  12:15:48
arrival 2018-10-31  09:34:43
arrival 2019-05-28  16:05:53
arrival 2020-10-01  14:14:52
arrival 2020-02-12  13:17:33
我想提取离开计数大于1的行(即员工离开大楼)。 每天可以有更多的到达人数,这可以包括员工在大楼内的移动。但是,我只需要在离开人数超过1人的天数内进行单独的df

我已使用以下命令对值进行排序:

df.sort_values(by=['date','time',], ascending=True).head(25)
用这个来计算出发的次数

dfNew = df.groupby(['date',  'direction']).size().reset_index(name='count')
正在获取此输出(很抱歉屏幕截图)。

然而,我想创建一个单独的df,它也包含时间列,其中只包含有更多离开的日期。 我尝试了以下方法

dfNew.loc[(dfNew['direction'] == 'departure') & (counteddf['count'] > 1)]
得到这个:

我如何使它也包括时间值,并使一个新的df?因为我是一个初学者,我相信一定有一个“干净”的解决方案,我可以缠绕我的头