Python 使用Pandas访问分组数据

Python 使用Pandas访问分组数据,python,pandas,grouping,Python,Pandas,Grouping,我有一个数据表,其中包含两个字段user\u id,article\u id,用于对特定文章发表评论的用户(暗示了许多关系) 我将数据分组如下: grouped=df_selected['article_id'].groupby([df_selected['user_id'],df_selected['article_id'])) 这基本上为我提供了所有用户的评论计数,每个特定用户的文章ID,见表。结果对象的类型为series 我想做两件事: (1) 命名第三列并将整个对象转换为熔融数据格式表的

我有一个数据表,其中包含两个字段user\u id,article\u id,用于对特定文章发表评论的用户(暗示了许多关系)

我将数据分组如下:

grouped=df_selected['article_id'].groupby([df_selected['user_id'],df_selected['article_id']))

这基本上为我提供了所有用户的评论计数,每个特定用户的文章ID,见表。结果对象的类型为series

我想做两件事:

(1) 命名第三列并将整个对象转换为熔融数据格式表的最佳方法是什么(即,即使“用户id”在多行中重复,每个“单元”也有信息-因此在图片示例中,将重复用户id 2和3)

(2) 我想检查的一件事是,没有用户针对特定文章写了超过一条评论(这是图片中的第三列)-我如何根据这一列进行筛选以进行检查?(非常感谢我可以在分组对象上进行迭代-但我想知道是否有一种矢量化的方法可以做到这一点…)

我想做的是用1,2,3。。。评论

提前谢谢

user_id  article_id  no of comments
6        73          2
43       18          2
         290         2
         311         2
374      763         2
         1539        2
380      690         4
         820         3
         863         2
387      575         2
         575         2
         690         2
         702         2

请复制并粘贴intepreter的输出(这样我们也可以这样做,并使用您的示例),而不是(无法使用)屏幕截图。如何将数据格式化为SO格式的表格?只有纯文本,带空格。如果在每行前面加上四个空格,文本将以代码样式显示。@user7289同样的效果高亮显示并按ctrl+kWhy进行向下表决?