Pandas 按&；分组后保留所有列；创建一个新的数据帧_Pandas_Dataframe

Pandas 按&；分组后保留所有列；创建一个新的数据帧

pandas dataframe

Pandas 按&；分组后保留所有列；创建一个新的数据帧,pandas,dataframe,Pandas,Dataframe,我一直在努力解决这项任务我有一个csv如下，加载到熊猫df。（对不起，伙计们，我不知道如何设置Jupyter输出的格式以便在这里发布：（关于格式的任何建议也值得一提）这代表一名员工的出勤率 direction date time departure 2018-02-14 15:48:27 departure 2018-09-10 13:22:05 arrival 2019-03-11 15:45:49 arrival 2019-09-27 09:45:52 arriv

我一直在努力解决这项任务

我有一个csv如下，加载到熊猫df。（对不起，伙计们，我不知道如何设置Jupyter输出的格式以便在这里发布：（关于格式的任何建议也值得一提）这代表一名员工的出勤率

direction   date    time
departure   2018-02-14  15:48:27
departure   2018-09-10  13:22:05
arrival 2019-03-11  15:45:49
arrival 2019-09-27  09:45:52
arrival 2019-04-04  11:16:08
arrival 2019-01-22  15:56:46
departure   2019-11-06  13:12:12
arrival 2019-05-07  14:35:47
arrival 2018-08-28  16:13:10
arrival 2020-10-06  11:27:23
departure   2020-07-09  16:45:59
arrival 2020-10-26  16:06:30
arrival 2018-07-16  11:07:30
arrival 2019-04-16  15:52:33
departure   2019-03-20  16:19:15
arrival 2019-05-30  12:15:48
arrival 2018-10-31  09:34:43
arrival 2019-05-28  16:05:53
arrival 2020-10-01  14:14:52
arrival 2020-02-12  13:17:33

我想提取离开计数大于1的行（即员工离开大楼）。每天可以有更多的到达人数，这可以包括员工在大楼内的移动。但是，我只需要在离开人数超过1人的天数内进行单独的df

我已使用以下命令对值进行排序：

df.sort_values(by=['date','time',], ascending=True).head(25)

用这个来计算出发的次数

dfNew = df.groupby(['date',  'direction']).size().reset_index(name='count')

正在获取此输出（很抱歉屏幕截图）。

然而，我想创建一个单独的df，它也包含时间列，其中只包含有更多离开的日期。我尝试了以下方法

dfNew.loc[(dfNew['direction'] == 'departure') & (counteddf['count'] > 1)]

得到这个：

我如何使它也包括时间值，并使一个新的df？因为我是一个初学者，我相信一定有一个“干净”的解决方案，我可以缠绕我的头