Python数据帧:在一列上使用Groupby计算R^2和RMSE

Python数据帧:在一列上使用Groupby计算R^2和RMSE,python,dataframe,pandas-groupby,Python,Dataframe,Pandas Groupby,我有以下Python数据框架: Type Actual Predicted A 4 3 A 10 18 A 13 11 B 3 10 B 4 2 B 8 33 C 20 17 C 40 33 C 87 80 C 32 30 我有计算R^2和RMSE的代码,但我不

我有以下Python数据框架:

Type    Actual  Predicted
A       4       3
A       10      18
A       13      11
B       3       10
B       4       2
B       8       33
C       20      17
C       40      33
C       87      80
C       32      30
我有计算R^2和RMSE的代码,但我不知道如何通过不同的“类型”计算它

现在,我的方法是将较大的表分解为三个较小的表,其中只包含A、B、C值,然后计算每个较小表的R^2和RMSE……然后将它们追加到一起

但上述方法效率低下,我相信应该有一个更简单的方法

以下是我希望在分组时生成结果的格式:

Type    R^2     RMSE    
A       value   value   
B       value   value   
C       value   value   

下面是一个
groupby
方法:

import numpy as np
import pandas as pd
from sklearn.metrics import r2_score, mean_squared_error

def r2_rmse( g ):
    r2 = r2_score( g['Actual'], g['Predicted'] )
    rmse = np.sqrt( mean_squared_error( g['Actual'], g['Predicted'] ) )
    return pd.Series( dict(  r2 = r2, rmse = rmse ) )

your_df.groupby( 'Type' ).apply( r2_rmse ).reset_index()

做一个groupby并将公式作为函数应用到整个列中,您是否介意给我们您的r^2和RMSE公式,以便我们可以测试一下?我(也许还有其他人)已经有一段时间没有上统计课了,这太神奇了!非常感谢。关于如何在置信区间内执行此操作的任何提示?
return
语句可以修改为
return pd.Series({'r2':r2,'rmse':rmse})