Python 熊猫:按月份划分的词频

Python 熊猫:按月份划分的词频,python,pandas,datetime,Python,Pandas,Datetime,我正在探索这样一个数据库 因此,这基本上是一个Youtube评论的集合,我已经开始分析:我已经成功地在一个广告栏中按评论数词,以及另一个针对ngrams的评论(我打算稍后再探讨)。 我已经设法得到了整个期间10个最常用单词的列表,但我无法按月份得到单词的频率:对于每个月,我想得到10个最常用单词的列表 谢谢你的帮助 我希望你能试试这个 作为pd进口熊猫 从收款进口柜台 备选案文1: df=df.set_index(df['at']) for u,v in df.groupby(pd.Group

我正在探索这样一个数据库

因此,这基本上是一个Youtube评论的集合,我已经开始分析:我已经成功地在一个广告栏中按评论数词,以及另一个针对ngrams的评论(我打算稍后再探讨)。 我已经设法得到了整个期间10个最常用单词的列表,但我无法按月份得到单词的频率:对于每个月,我想得到10个最常用单词的列表


谢谢你的帮助

我希望你能试试这个

作为pd进口熊猫 从收款进口柜台

备选案文1:

df=df.set_index(df['at'])
for u,v in df.groupby(pd.Grouper(freq="M")):
    words=sum(v['text'].str.split(' ').values.tolist(),[])
    c = Counter(words)
    print c.most_common(10)
备选案文2:

df=df.set_index(df['at'])
for u,v in df.groupby(pd.Grouper(freq="M")):
    words=sum(v['text'].str.split(' ').values.tolist(),[])
    top_words=pd.Series(words).value_counts()[:10]
    print top_words.index.tolist()

不要将图像粘贴为输入。无论如何,要完成这项任务,请按月筛选数据帧,然后从系列文章中选出前10个单词。这太棒了!两个都工作得很好!谢谢!为了让我更好地理解它,u和v在你的循环中代表什么?我真的不明白它是如何工作的…@PaulineZiserman-
pd.Grouper(freq=“M”)
它按月对数据帧进行分组,即每个迭代包含每个月的数据。V包含过滤后的数据帧,U包含组的名称。欲了解更多详情,请访问:,