Python 计算数据帧中的摘要行
以下是我目前创建的(熊猫数据框架): 代码: 输出:Python 计算数据帧中的摘要行,python,pandas,python-2.7,Python,Pandas,Python 2.7,以下是我目前创建的(熊猫数据框架): 代码: 输出: Assignee~IssueType~Analysis~Blocked~Closed~Done~In Progress~Open~Ready For QA Testing~Total Smith, John~Story~0~0~0~0~0~1~0~1 Smith, John~Sub-task~0~0~0~0~0~1~0~1 Smith, John~Task~0~0~0~0~2~5~0~7 Doe, Jane~Bug~0~0~0~0~1~0~0
Assignee~IssueType~Analysis~Blocked~Closed~Done~In Progress~Open~Ready For QA Testing~Total
Smith, John~Story~0~0~0~0~0~1~0~1
Smith, John~Sub-task~0~0~0~0~0~1~0~1
Smith, John~Task~0~0~0~0~2~5~0~7
Doe, Jane~Bug~0~0~0~0~1~0~0~1
Polo, Marco~Bug~0~0~0~0~0~2~0~2
Polo, Marco~Story~0~0~1~0~0~0~0~1
Polo, Marco~Task~1~0~0~0~4~2~0~7
以下是我想要的(考虑到我可以有数字/非数字列:
Assignee~IssueType~Analysis~Blocked~Closed~Done~In Progress~Open~Ready For QA Testing~Total
Smith, John~Story~0~0~0~0~0~1~0~1
Smith, John~Sub-task~0~0~0~0~0~1~0~1
Smith, John~Task~0~0~0~0~2~5~0~7
Doe, Jane~Bug~0~0~0~0~1~0~0~1
Polo, Marco~Bug~0~0~0~0~0~2~0~2
Polo, Marco~Story~0~0~1~0~0~0~0~1
Polo, Marco~Task~1~0~0~0~4~2~0~7
**GrandTotal~GrandTotal~1~0~1~0~7~11~0~20**
使用数据帧实现这一点的最佳方法是什么?
提前感谢您的帮助。这是我对这个问题的回答。也许还有改进的余地(但至少我满意) 以下是输出:
请使用空格而不是波浪号来分隔列SOK。因此,如果我更改sep=“\t”,解决方案是什么?Pandas实际上没有摘要行。也许你可以这样做。感谢Josh Friedlander和其他审阅此问题的人。我很抱歉没有注意到标题没有意义,感谢你对其进行编辑。
Assignee~IssueType~Analysis~Blocked~Closed~Done~In Progress~Open~Ready For QA Testing~Total
Smith, John~Story~0~0~0~0~0~1~0~1
Smith, John~Sub-task~0~0~0~0~0~1~0~1
Smith, John~Task~0~0~0~0~2~5~0~7
Doe, Jane~Bug~0~0~0~0~1~0~0~1
Polo, Marco~Bug~0~0~0~0~0~2~0~2
Polo, Marco~Story~0~0~1~0~0~0~0~1
Polo, Marco~Task~1~0~0~0~4~2~0~7
**GrandTotal~GrandTotal~1~0~1~0~7~11~0~20**
def append_summary_total(df_index, file_path, delimiter):
file_path = os.path.abspath(file_path)
delimiter = str(delimiter)
df = pd.read_csv(file_path, sep=delimiter)
sums = df.select_dtypes(pd.np.number).sum().rename('Grand Total')
df.loc['Grand Total'] = df.select_dtypes(pd.np.number).sum()
df = df.fillna("GrandTotal")
df = df.set_index(df_index)
df = df.apply(pd.to_numeric, errors='ignore')
df = df.astype(int)
df.to_csv(file_path, sep=delimiter)