如何删除重复项，但聚合重复行的总和（Python或Excel）_Python_Excel

如何删除重复项，但聚合重复行的总和（Python或Excel）

python excel

如何删除重复项，但聚合重复行的总和（Python或Excel）,python,excel,Python,Excel,例如，我有一个符号和数量列 AAA 1000000 AAA 1000000 AAA 1000000 BBB 5000000 CCC 1000000 CCC 1000000 本质上看起来像 AAA 3000000 BBB 5500000 CCC 2000000 根据Rayhane的建议尝试： import pandas as pd a = pd.read_csv("file.csv") df = pd.DataFrame(a) df['Quantity'] = df.groupby(['Sym

例如，我有一个符号和数量列

AAA 1000000
AAA 1000000
AAA 1000000
BBB 5000000
CCC 1000000
CCC 1000000

本质上看起来像

AAA 3000000
BBB 5500000
CCC 2000000

根据Rayhane的建议尝试：

import pandas as pd
a = pd.read_csv("file.csv")
df = pd.DataFrame(a)
df['Quantity'] = df.groupby(['Symbol']).transform('sum')
df.drop_duplicates(inplace=True)

奇怪的是，代码看起来很有效，但行数保持不变。（5000行，我本以为会降到2000行左右）。有人可以验证我的代码吗？

在这里，您可以执行以下操作：

df['Quantity'] = df.groupby(['Symbol']).transform('sum')
df.drop_duplicates(inplace=True)

文件：

输入：

  Symbol  Quantity
0    AAA   1000000
1    AAA   1000000
2    AAA   1000000
3    BBB   5000000
4    CCC   1000000
5    CCC   1000000

现在如果打印（df）：

即使您愿意，您也可以：

df.reset_index(drop=True,inplace=True)

输出变为：

  Symbol  Quantity
0    AAA   3000000
1    BBB   5000000
2    CCC   2000000

你能说得更具体一点吗？你愿意使用熊猫库吗？是的，我想知道熊猫包中是否有一个简单的命令。所以，我为格式错误道歉。第一次发布！现在看起来应该更好了。您是否需要帮助将excel文件读取到数据框中，或者这已经解决了？没问题，如果答案适合未来用户的需要，请随意接受@hiimarkman

  Symbol  Quantity
0    AAA   3000000
1    BBB   5000000
2    CCC   2000000