Python 根据数据格式合并CSV文件数据单元格

Python 根据数据格式合并CSV文件数据单元格,python,csv,Python,Csv,我有一个大约有一百万行的CSV文件。 比如说,它的细节如下 Name | Age | Salary name 1 52 10000 name 2 55 10043 name 3 50 100054 name 2 55 10023 name 1 52 100322... 很快 但我需要合并多余的细节。 需要像这样的输出 Name | Age | S

我有一个大约有一百万行的CSV文件。 比如说,它的细节如下

Name      |   Age   | Salary 
name 1      52       10000
name 2      55       10043 
name 3      50       100054
name 2      55       10023
name 1      52       100322...
很快

但我需要合并多余的细节。 需要像这样的输出

Name      |   Age   | Salary 
name 1      52       110322*
name 2      55       20066 *
name 3      50       100054 

您可能会注意到,重复名称1和名称2的详细信息被合并并添加了薪资值。因此,我正在寻找将此更改应用于原始数据集的方法。所以我需要一个python脚本来解决我的问题

首先,您不是在合并数据集,而是在聚合数据集

考虑使用这个包。导入csv作为数据框,然后使用group by sum函数聚合薪资字段和其他数量值。将相同原则应用于其他相关字段:

#!/usr/bin/python
import pandas as pd

df = pd.read_csv('C:\\Path\\To\\InputCSV.csv')

newdf = df.groupby('Name', 'Age').sum()

newdf = to_csv('C:\\Path\\To\\OutputCSV.csv')
使用以下命令

>>> import pandas as pd
>>> data = pd.read_csv('data.csv')
>>> data_merged = data.groupby(['Name', 'Age']).sum().reset_index()
>>> data_merged

    Name   Age  Salary 
0  name 1   52   110322
1  name 2   55    20066
2  name 3   50   100054

显示不工作的代码。我看不出有问题。只有要求。有问题吗?