Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/excel/23.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何删除重复项,但聚合重复行的总和(Python或Excel)_Python_Excel - Fatal编程技术网

如何删除重复项,但聚合重复行的总和(Python或Excel)

如何删除重复项,但聚合重复行的总和(Python或Excel),python,excel,Python,Excel,例如,我有一个符号和数量列 AAA 1000000 AAA 1000000 AAA 1000000 BBB 5000000 CCC 1000000 CCC 1000000 本质上看起来像 AAA 3000000 BBB 5500000 CCC 2000000 根据Rayhane的建议尝试: import pandas as pd a = pd.read_csv("file.csv") df = pd.DataFrame(a) df['Quantity'] = df.groupby(['Sym

例如,我有一个符号数量

AAA 1000000
AAA 1000000
AAA 1000000
BBB 5000000
CCC 1000000
CCC 1000000
本质上看起来像

AAA 3000000
BBB 5500000
CCC 2000000
根据Rayhane的建议尝试:

import pandas as pd
a = pd.read_csv("file.csv")
df = pd.DataFrame(a)
df['Quantity'] = df.groupby(['Symbol']).transform('sum')
df.drop_duplicates(inplace=True)
奇怪的是,代码看起来很有效,但行数保持不变。(5000行,我本以为会降到2000行左右)。有人可以验证我的代码吗?

在这里,您可以执行以下操作:

df['Quantity'] = df.groupby(['Symbol']).transform('sum')
df.drop_duplicates(inplace=True)
文件:

输入:

  Symbol  Quantity
0    AAA   1000000
1    AAA   1000000
2    AAA   1000000
3    BBB   5000000
4    CCC   1000000
5    CCC   1000000
现在如果打印(df):

即使您愿意,您也可以:

df.reset_index(drop=True,inplace=True)
输出变为:

  Symbol  Quantity
0    AAA   3000000
1    BBB   5000000
2    CCC   2000000

你能说得更具体一点吗?你愿意使用熊猫库吗?是的,我想知道熊猫包中是否有一个简单的命令。所以,我为格式错误道歉。第一次发布!现在看起来应该更好了。您是否需要帮助将excel文件读取到数据框中,或者这已经解决了?没问题,如果答案适合未来用户的需要,请随意接受@hiimarkman
  Symbol  Quantity
0    AAA   3000000
1    BBB   5000000
2    CCC   2000000