Pandas 按&;分组后保留所有列;创建一个新的数据帧
我一直在努力解决这项任务 我有一个csv如下,加载到熊猫df。(对不起,伙计们,我不知道如何设置Jupyter输出的格式以便在这里发布:(关于格式的任何建议也值得一提)这代表一名员工的出勤率Pandas 按&;分组后保留所有列;创建一个新的数据帧,pandas,dataframe,Pandas,Dataframe,我一直在努力解决这项任务 我有一个csv如下,加载到熊猫df。(对不起,伙计们,我不知道如何设置Jupyter输出的格式以便在这里发布:(关于格式的任何建议也值得一提)这代表一名员工的出勤率 direction date time departure 2018-02-14 15:48:27 departure 2018-09-10 13:22:05 arrival 2019-03-11 15:45:49 arrival 2019-09-27 09:45:52 arriv
direction date time
departure 2018-02-14 15:48:27
departure 2018-09-10 13:22:05
arrival 2019-03-11 15:45:49
arrival 2019-09-27 09:45:52
arrival 2019-04-04 11:16:08
arrival 2019-01-22 15:56:46
departure 2019-11-06 13:12:12
arrival 2019-05-07 14:35:47
arrival 2018-08-28 16:13:10
arrival 2020-10-06 11:27:23
departure 2020-07-09 16:45:59
arrival 2020-10-26 16:06:30
arrival 2018-07-16 11:07:30
arrival 2019-04-16 15:52:33
departure 2019-03-20 16:19:15
arrival 2019-05-30 12:15:48
arrival 2018-10-31 09:34:43
arrival 2019-05-28 16:05:53
arrival 2020-10-01 14:14:52
arrival 2020-02-12 13:17:33
我想提取离开计数大于1的行(即员工离开大楼)。
每天可以有更多的到达人数,这可以包括员工在大楼内的移动。但是,我只需要在离开人数超过1人的天数内进行单独的df
我已使用以下命令对值进行排序:
df.sort_values(by=['date','time',], ascending=True).head(25)
用这个来计算出发的次数
dfNew = df.groupby(['date', 'direction']).size().reset_index(name='count')
正在获取此输出(很抱歉屏幕截图)。
然而,我想创建一个单独的df,它也包含时间列,其中只包含有更多离开的日期。
我尝试了以下方法
dfNew.loc[(dfNew['direction'] == 'departure') & (counteddf['count'] > 1)]
得到这个:
我如何使它也包括时间值,并使一个新的df?因为我是一个初学者,我相信一定有一个“干净”的解决方案,我可以缠绕我的头