Python 我使用groupby.sum()是否正确?

Python 我使用groupby.sum()是否正确?,python,pandas,dataframe,Python,Pandas,Dataframe,我有以下代码,在新的_df[“SUM”]行中有一个问题: 为了提供一些上下文,它所做的是:获取具有相同ID的每一行,用“,”分隔数字,对这些数字进行一些数学运算(这就是“增量”(我知道它不是增量)行所涉及的地方),最后汇总每个ID的所有“增量”,按原始ID对它们进行分组,所以我保持相同的行数 而且,当我使用一个数据样本(一开始评论过的样本)时,它工作得非常完美,给了我希望的结果: ID SUM SEQ 0 C9JLR9 3

我有以下代码,在新的_df[“SUM”]行中有一个问题:

为了提供一些上下文,它所做的是:获取具有相同ID的每一行,用“,”分隔数字,对这些数字进行一些数学运算(这就是“增量”(我知道它不是增量)行所涉及的地方),最后汇总每个ID的所有“增量”,按原始ID对它们进行分组,所以我保持相同的行数

而且,当我使用一个数据样本(一开始评论过的样本)时,它工作得非常完美,给了我希望的结果:

       ID  SUM                            SEQ
0  C9JLR9  353  1 100,182 250,329 417,490 583
1  O95391  244          1 100,206 254,493 586
2  P05114  101                          1 100
3  P14866  196                  1 100,284 378
但是,当我在Excel文件(有10471行)中使用它时,groupby.sum()行并没有按预期的那样工作(我已经检查了所有其他内容,我知道错误在该行中)。 这是我收到的输出:

           ID  SUM                            SEQ
0      C9JLR9   39  1 100,182 250,329 417,490 583
1      O95391   20          1 100,206 254,493 586
2      P05114   33                          1 100
4      P98177   21                  1 100,176 246

您可以清楚地看到总和值不同(并且根本不正确)。我也不知道这些数字是从哪里来的。这真的很奇怪。

如果有人感兴趣,可以在评论中找到解决方案:我必须用以下内容更改行:

new_df["SUM"] = new_df.groupby("ID")["delta"].transform("sum")


IIUC使用
new_-df[“SUM”]=new_-df.groupby(“ID”)[“delta”].transform(“SUM”)
代替。它在示例dict上运行良好,我正在运行整个文件。如果有用的话,我会让你知道的,谢谢!它工作得很好,谢谢!!
new_df["SUM"] = new_df.groupby("ID")["delta"].transform("sum")