如何删除重复项,但聚合重复行的总和(Python或Excel)
例如,我有一个符号和数量列如何删除重复项,但聚合重复行的总和(Python或Excel),python,excel,Python,Excel,例如,我有一个符号和数量列 AAA 1000000 AAA 1000000 AAA 1000000 BBB 5000000 CCC 1000000 CCC 1000000 本质上看起来像 AAA 3000000 BBB 5500000 CCC 2000000 根据Rayhane的建议尝试: import pandas as pd a = pd.read_csv("file.csv") df = pd.DataFrame(a) df['Quantity'] = df.groupby(['Sym
AAA 1000000
AAA 1000000
AAA 1000000
BBB 5000000
CCC 1000000
CCC 1000000
本质上看起来像
AAA 3000000
BBB 5500000
CCC 2000000
根据Rayhane的建议尝试:
import pandas as pd
a = pd.read_csv("file.csv")
df = pd.DataFrame(a)
df['Quantity'] = df.groupby(['Symbol']).transform('sum')
df.drop_duplicates(inplace=True)
奇怪的是,代码看起来很有效,但行数保持不变。(5000行,我本以为会降到2000行左右)。有人可以验证我的代码吗?在这里,您可以执行以下操作:
df['Quantity'] = df.groupby(['Symbol']).transform('sum')
df.drop_duplicates(inplace=True)
文件:
输入:
Symbol Quantity
0 AAA 1000000
1 AAA 1000000
2 AAA 1000000
3 BBB 5000000
4 CCC 1000000
5 CCC 1000000
现在如果打印(df):
即使您愿意,您也可以:
df.reset_index(drop=True,inplace=True)
输出变为:
Symbol Quantity
0 AAA 3000000
1 BBB 5000000
2 CCC 2000000
你能说得更具体一点吗?你愿意使用熊猫库吗?是的,我想知道熊猫包中是否有一个简单的命令。所以,我为格式错误道歉。第一次发布!现在看起来应该更好了。您是否需要帮助将excel文件读取到数据框中,或者这已经解决了?没问题,如果答案适合未来用户的需要,请随意接受@hiimarkman
Symbol Quantity
0 AAA 3000000
1 BBB 5000000
2 CCC 2000000