Python 熊猫：按月份划分的词频_Python_Pandas_Datetime

Python 熊猫：按月份划分的词频

python pandas datetime

Python 熊猫：按月份划分的词频,python,pandas,datetime,Python,Pandas,Datetime,我正在探索这样一个数据库因此，这基本上是一个Youtube评论的集合，我已经开始分析：我已经成功地在一个广告栏中按评论数词，以及另一个针对ngrams的评论（我打算稍后再探讨）。我已经设法得到了整个期间10个最常用单词的列表，但我无法按月份得到单词的频率：对于每个月，我想得到10个最常用单词的列表谢谢你的帮助我希望你能试试这个作为pd进口熊猫从收款进口柜台备选案文1： df=df.set_index(df['at']) for u,v in df.groupby(pd.Group

我正在探索这样一个数据库

因此，这基本上是一个Youtube评论的集合，我已经开始分析：我已经成功地在一个广告栏中按评论数词，以及另一个针对ngrams的评论（我打算稍后再探讨）。我已经设法得到了整个期间10个最常用单词的列表，但我无法按月份得到单词的频率：对于每个月，我想得到10个最常用单词的列表

谢谢你的帮助

我希望你能试试这个

作为pd进口熊猫从收款进口柜台

备选案文1：

df=df.set_index(df['at'])
for u,v in df.groupby(pd.Grouper(freq="M")):
    words=sum(v['text'].str.split(' ').values.tolist(),[])
    c = Counter(words)
    print c.most_common(10)

备选案文2：

df=df.set_index(df['at'])
for u,v in df.groupby(pd.Grouper(freq="M")):
    words=sum(v['text'].str.split(' ').values.tolist(),[])
    top_words=pd.Series(words).value_counts()[:10]
    print top_words.index.tolist()

不要将图像粘贴为输入。无论如何，要完成这项任务，请按月筛选数据帧，然后从系列文章中选出前10个单词。这太棒了！两个都工作得很好！谢谢！为了让我更好地理解它，u和v在你的循环中代表什么？我真的不明白它是如何工作的…@PaulineZiserman-

pd.Grouper（freq=“M”）

它按月对数据帧进行分组，即每个迭代包含每个月的数据。V包含过滤后的数据帧，U包含组的名称。欲了解更多详情，请访问：，