Python 大数据帧上的Pandas GroupBy_Python_Pandas_Dataframe

Python 大数据帧上的Pandas GroupBy

python pandas dataframe

Python 大数据帧上的Pandas GroupBy,python,pandas,dataframe,Python,Pandas,Dataframe,我有一个包含150列的数据框。在150列中，有15列类型为string，其余都是float dataframe包含15个字符串列组合的相同记录，rest中的值可能不同。我想对这15个字符串列进行groupby，并对所有浮点列进行求和由于数据帧非常庞大，我如何在Python中轻松做到这一点，而无需在groupby语句中指定每列的名称。这是对您工作的提示。您可以使用此代码筛选字符串类型的列 string_columns = list() for col in df.columns:

我有一个包含150列的数据框。在150列中，有15列类型为string，其余都是float

dataframe包含15个字符串列组合的相同记录，rest中的值可能不同。我想对这15个字符串列进行groupby，并对所有浮点列进行求和

由于数据帧非常庞大，我如何在Python中轻松做到这一点，而无需在groupby语句中指定每列的名称。

这是对您工作的提示。您可以使用此代码筛选字符串类型的列

string_columns = list()    
for col in df.columns:
    if df[col].dtypes == 'O':
        string_columns.append(col)

最后，字符串列将包含具有对象数据类型的列名，可用于groupby函数。

工作提示。您可以使用此代码筛选字符串类型的列

string_columns = list()    
for col in df.columns:
    if df[col].dtypes == 'O':
        string_columns.append(col)

最后，字符串列将包含对象数据类型的列名，可用于groupby函数。

使用列表过滤对象类型的列，并使用groupby函数中的列

cols=[col代表df.columns中的col，如果df[col].dtype==np.object]
df.groupby（cols.sum）（）

使用列表过滤类型为object type的列，并按函数使用分组中的列

cols=[col代表df.columns中的col，如果df[col].dtype==np.object]
df.groupby（cols.sum）（）

提供的答案被标记为低质量帖子供审查。以下是一些指导原则。提供的答案可能是正确的，但可以从解释中获益。仅代码答案不被视为“好”答案。From。使用了groupby语法。。ThanksI确实注意到groupby之后，没有任何记录在groupby前后保持不变。如果列组（COL）具有唯一值，则可能会发生这种情况。提供的答案被标记为低质量帖子以供审查。以下是一些指导原则。提供的答案可能是正确的，但可以从解释中获益。仅代码答案不被视为“好”答案。From。使用了groupby语法。。ThanksI确实注意到groupby之后，前后没有记录保持不变。如果列组（COL）具有唯一的值，则可能发生这种情况。这有助于获得我需要的内容。这有助于获得我需要的内容。