Python 如何按时间和其他条件对数据帧进行排序?

Python 如何按时间和其他条件对数据帧进行排序?,python,pandas,numpy,data-manipulation,data-cleaning,Python,Pandas,Numpy,Data Manipulation,Data Cleaning,我有一个包含以下列的数据框:movie\u name,date,comment 日期格式如下(示例):2018-06-27T09:09:00Z 我想制作一个新的数据帧,它只包含某部电影的第一个日期 例如,对于电影a,第一个日期可能2018-09-11T:02:02:00Z,在这种情况下,我希望电影a的所有行都在2018-09-11。当有多部电影的日期不同时,我该怎么做?这里有一种方法: import datetime as dt df['My Time Format'] = dt['Given

我有一个包含以下列的数据框:
movie\u name
date
comment

日期格式如下(示例):
2018-06-27T09:09:00Z

我想制作一个新的数据帧,它只包含某部电影的第一个日期

例如,对于电影a,第一个日期可能
2018-09-11T:02:02:00Z
,在这种情况下,我希望电影a的所有行都在2018-09-11。当有多部电影的日期不同时,我该怎么做?

这里有一种方法:

import datetime as dt
df['My Time Format'] = dt['Given time].apply(lambda x: dt.datetime.strftime(dt.datetime.strptime(x, "%Y-%m-%dT%H:%M:%SZ"),"%Y-%m-%d"))
# create a new df
new_df = old_df['date'].copy()

# get the date
new_df['date'] = pd.to_datetime(new_df['date']).dt.date

# first date of movie
new_df.groupby('movie_name')['date'].first()

这与您是否尝试在数据库的类型部分中使用
date
而不是
datetime
相同?我如何使用date类型来实现这一点?是的,我已经转换了日期,但我仍然不知道如何创建包含某部电影的第一个日期行的新数据框。您是否使用了df.groupby(['My Time Format'))是的,我已经改变了日期,但是我如何制作一个只包含某部电影的第一个日期的新数据框呢?例如,如果电影“a”的第一个日期是2018年9月11日,我将如何仅提取具有该特定日期的行。如果有多部日期不同的电影,我该怎么做?