Python 大数据帧上的Pandas GroupBy

Python 大数据帧上的Pandas GroupBy,python,pandas,dataframe,Python,Pandas,Dataframe,我有一个包含150列的数据框。在150列中,有15列类型为string,其余都是float dataframe包含15个字符串列组合的相同记录,rest中的值可能不同。我想对这15个字符串列进行groupby,并对所有浮点列进行求和 由于数据帧非常庞大,我如何在Python中轻松做到这一点,而无需在groupby语句中指定每列的名称。这是对您工作的提示。您可以使用此代码筛选字符串类型的列 string_columns = list() for col in df.columns:

我有一个包含150列的数据框。在150列中,有15列类型为string,其余都是float

dataframe包含15个字符串列组合的相同记录,rest中的值可能不同。我想对这15个字符串列进行groupby,并对所有浮点列进行求和


由于数据帧非常庞大,我如何在Python中轻松做到这一点,而无需在groupby语句中指定每列的名称。

这是对您工作的提示。您可以使用此代码筛选字符串类型的列

string_columns = list()    
for col in df.columns:
    if df[col].dtypes == 'O':
        string_columns.append(col)

最后,字符串列将包含具有对象数据类型的列名,可用于groupby函数。

工作提示。您可以使用此代码筛选字符串类型的列

string_columns = list()    
for col in df.columns:
    if df[col].dtypes == 'O':
        string_columns.append(col)

最后,字符串列将包含对象数据类型的列名,可用于groupby函数。

使用列表过滤对象类型的列,并使用groupby函数中的列

cols=[col代表df.columns中的col,如果df[col].dtype==np.object]
df.groupby(cols.sum)()

使用列表过滤类型为object type的列,并按函数使用分组中的列

cols=[col代表df.columns中的col,如果df[col].dtype==np.object]
df.groupby(cols.sum)()

提供的答案被标记为低质量帖子供审查。以下是一些指导原则。提供的答案可能是正确的,但可以从解释中获益。仅代码答案不被视为“好”答案。From。使用了groupby语法。。ThanksI确实注意到groupby之后,没有任何记录在groupby前后保持不变。如果列组(COL)具有唯一值,则可能会发生这种情况。提供的答案被标记为低质量帖子以供审查。以下是一些指导原则。提供的答案可能是正确的,但可以从解释中获益。仅代码答案不被视为“好”答案。From。使用了groupby语法。。ThanksI确实注意到groupby之后,前后没有记录保持不变。如果列组(COL)具有唯一的值,则可能发生这种情况。这有助于获得我需要的内容。这有助于获得我需要的内容。