Python-在随机林或梯度增强回归器中允许groupby吗?
我的数据集如下所示:Python-在随机林或梯度增强回归器中允许groupby吗?,python,pandas,machine-learning,data-science,sklearn-pandas,Python,Pandas,Machine Learning,Data Science,Sklearn Pandas,我的数据集如下所示: state year response 1 MA 1 -0.2038564714 2 MA 2 -1.9344440707 3 MA 3 -0.3105101158 4 MA 4 -0.4222270032 5 MA 5 0.6818296904 6 MA 6 1.0094961857 7 MA 7 -0.7261049649
state year response
1 MA 1 -0.2038564714
2 MA 2 -1.9344440707
3 MA 3 -0.3105101158
4 MA 4 -0.4222270032
5 MA 5 0.6818296904
6 MA 6 1.0094961857
7 MA 7 -0.7261049649
8 MA 8 0.8061088684
9 MA 9 1.4243231097
10 MA 10 -0.7841440048
11 NY 1 -0.6524043665
12 NY 2 0.6507783632
13 NY 3 0.1830479699
14 NY 4 0.5487749604
15 NY 5 1.4046842945
16 NY 6 0.3870831196
17 NY 7 1.0517012702
18 NY 8 0.6229054623
19 NY 9 0.4336203898
20 NY 10 0.3860844382
我想建立一个回归模型,以GROUPBY作为“状态”变量
我不知道如何使用随机森林回归或梯度推进算法进行回归分组
max_depth = 30
regr_multirf = MultiOutputRegressor(RandomForestRegressor(max_depth=max_depth,
random_state=0))
regr_multirf.fit(X_train, y_train)
因为我对python非常陌生(我编写代码的第一天),所以我不知道如何在这里包含groupby
有一个类似的代码[这里][1]使用线性回归。虽然它有groupby功能,但我不知道Randomforest[1]:是否有此功能。在此方面的任何帮助都将不胜感激
多谢各位 @ChihebNexus-是的,先生,我用的是熊猫。刚才也更新了熊猫主题,谢谢。你能添加你想要的输出样本吗?@ChihebNexus-有效的问题,先生。但是我现在没有输出。如果你看到输入数据,它是一种来自两个不同状态的时间序列数据。我想应用带有group by的多输出回归算法,以便对模型进行训练并预测不同的状态。在link()中给出了一个类似的示例,虽然不确切,但我希望使用与链接中提到的类似的groupby