Python 有没有办法在pandas中使用groupby函数,以便将某些内容引用为0?
所以我有一个CSV文件,我在熊猫中使用它,它包含了从网上获取的帖子中是否包含某个单词的信息。假设我在看体育,CSV文件基本上如下所示:Python 有没有办法在pandas中使用groupby函数,以便将某些内容引用为0?,python,pandas,Python,Pandas,所以我有一个CSV文件,我在熊猫中使用它,它包含了从网上获取的帖子中是否包含某个单词的信息。假设我在看体育,CSV文件基本上如下所示: Date of Post Sport Mentioned 9-22 Basketball 9-22 Hockey 9-22 Football 9-24 Baseball 9-24 Hockey 9-24
Date of Post Sport Mentioned
9-22 Basketball
9-22 Hockey
9-22 Football
9-24 Baseball
9-24 Hockey
9-24 Football
我希望这样,当我使用groupby('Date of Post').count()时,它将在9-23显示0,因为在该日期没有提到任何运动。有办法做到这一点吗?我很确定pandas会将第一列视为日期,而不仅仅是一个常规字符串。使用
DataFrame。重新采样
:
df['Date of Post'] = pd.to_datetime(df['Date of Post'], format='%m-%d')
df.resample('D', on='Date of Post').size()
Date of Post
1900-09-22 3
1900-09-23 0
1900-09-24 3
Freq: D, dtype: int64
如果要添加正确的年份,请使用:
df['Date of Post'] = pd.to_datetime('2020-' + df['Date of Post'], format='%Y-%m-%d')
df.resample('D', on='Date of Post').size()
Date of Post
2020-09-22 3
2020-09-23 0
2020-09-24 3
Freq: D, dtype: int64