Python 使用Pandas访问分组数据_Python_Pandas_Grouping

Python 使用Pandas访问分组数据

python pandas

Python 使用Pandas访问分组数据,python,pandas,grouping,Python,Pandas,Grouping,我有一个数据表，其中包含两个字段user\u id，article\u id，用于对特定文章发表评论的用户（暗示了许多关系）我将数据分组如下： grouped=df_selected['article_id'].groupby（[df_selected['user_id']，df_selected['article_id']））这基本上为我提供了所有用户的评论计数，每个特定用户的文章ID，见表。结果对象的类型为series 我想做两件事：（1）命名第三列并将整个对象转换为熔融数据格式表的

我有一个数据表，其中包含两个字段user\u id，article\u id，用于对特定文章发表评论的用户（暗示了许多关系）

我将数据分组如下：

grouped=df_selected['article_id'].groupby（[df_selected['user_id']，df_selected['article_id']））

这基本上为我提供了所有用户的评论计数，每个特定用户的文章ID，见表。结果对象的类型为series

我想做两件事：

（1）命名第三列并将整个对象转换为熔融数据格式表的最佳方法是什么（即，即使“用户id”在多行中重复，每个“单元”也有信息-因此在图片示例中，将重复用户id 2和3）

（2）我想检查的一件事是，没有用户针对特定文章写了超过一条评论（这是图片中的第三列）-我如何根据这一列进行筛选以进行检查？（非常感谢我可以在分组对象上进行迭代-但我想知道是否有一种矢量化的方法可以做到这一点…）

我想做的是用1，2，3。。。评论

提前谢谢

user_id  article_id  no of comments
6        73          2
43       18          2
         290         2
         311         2
374      763         2
         1539        2
380      690         4
         820         3
         863         2
387      575         2
         575         2
         690         2
         702         2

请复制并粘贴intepreter的输出（这样我们也可以这样做，并使用您的示例），而不是（无法使用）屏幕截图。如何将数据格式化为SO格式的表格？只有纯文本，带空格。如果在每行前面加上四个空格，文本将以代码样式显示。@user7289同样的效果高亮显示并按ctrl+kWhy进行向下表决？