Python 我使用groupby.sum（）是否正确？_Python_Pandas_Dataframe

Python 我使用groupby.sum（）是否正确？

python pandas dataframe

Python 我使用groupby.sum（）是否正确？,python,pandas,dataframe,Python,Pandas,Dataframe,我有以下代码，在新的_df[“SUM”]行中有一个问题：为了提供一些上下文，它所做的是：获取具有相同ID的每一行，用“，”分隔数字，对这些数字进行一些数学运算（这就是“增量”（我知道它不是增量）行所涉及的地方），最后汇总每个ID的所有“增量”，按原始ID对它们进行分组，所以我保持相同的行数而且，当我使用一个数据样本（一开始评论过的样本）时，它工作得非常完美，给了我希望的结果： ID SUM SEQ 0 C9JLR9 3

我有以下代码，在新的_df[“SUM”]行中有一个问题：

为了提供一些上下文，它所做的是：获取具有相同ID的每一行，用“，”分隔数字，对这些数字进行一些数学运算（这就是“增量”（我知道它不是增量）行所涉及的地方），最后汇总每个ID的所有“增量”，按原始ID对它们进行分组，所以我保持相同的行数

而且，当我使用一个数据样本（一开始评论过的样本）时，它工作得非常完美，给了我希望的结果：

       ID  SUM                            SEQ
0  C9JLR9  353  1 100,182 250,329 417,490 583
1  O95391  244          1 100,206 254,493 586
2  P05114  101                          1 100
3  P14866  196                  1 100,284 378

但是，当我在Excel文件（有10471行）中使用它时，groupby.sum（）行并没有按预期的那样工作（我已经检查了所有其他内容，我知道错误在该行中）。这是我收到的输出：

           ID  SUM                            SEQ
0      C9JLR9   39  1 100,182 250,329 417,490 583
1      O95391   20          1 100,206 254,493 586
2      P05114   33                          1 100
4      P98177   21                  1 100,176 246

您可以清楚地看到总和值不同（并且根本不正确）。我也不知道这些数字是从哪里来的。这真的很奇怪。

如果有人感兴趣，可以在评论中找到解决方案：我必须用以下内容更改行：

new_df["SUM"] = new_df.groupby("ID")["delta"].transform("sum")

IIUC使用

new_-df[“SUM”]=new_-df.groupby（“ID”）[“delta”].transform（“SUM”）

代替。它在示例dict上运行良好，我正在运行整个文件。如果有用的话，我会让你知道的，谢谢！它工作得很好，谢谢！！

new_df["SUM"] = new_df.groupby("ID")["delta"].transform("sum")