Python 随机森林：重采样时对单个观测值进行加权_Python_R_Scikit Learn_Random Forest

Python 随机森林：重采样时对单个观测值进行加权

python r scikit-learn

Python 随机森林：重采样时对单个观测值进行加权,python,r,scikit-learn,random-forest,Python,R,Scikit Learn,Random Forest,我目前正在使用一个全国代表性数据集上的随机森林，每个观测值都包含概率权重，希望我能在引导过程中使用这些权重我主要是一个使用randomForest软件包的R用户，经过一些调查，我发现虽然可以对特定的类进行加权，但似乎没有一种方法可以对特定的观察结果进行加权。请参见第一个答案的注释另一方面，在python中实现scikit的随机林有一个示例_-weight参数，它以我需要的方式对观察值进行加权我只是好奇地想知道：是否有一种方法可以使用现有的R包对R中的随机林的观测值进行加权，或者我是否应该转

我目前正在使用一个全国代表性数据集上的随机森林，每个观测值都包含概率权重，希望我能在引导过程中使用这些权重

我主要是一个使用randomForest软件包的R用户，经过一些调查，我发现虽然可以对特定的类进行加权，但似乎没有一种方法可以对特定的观察结果进行加权。请参见第一个答案的注释

另一方面，在python中实现scikit的随机林有一个示例_-weight参数，它以我需要的方式对观察值进行加权

我只是好奇地想知道：是否有一种方法可以使用现有的R包对R中的随机林的观测值进行加权，或者我是否应该转到Python来完成这项任务？

我没有看到任何迹象表明可以直接使用随机林来完成这项工作。如果您想对样本进行加权，可以手动创建一个新的数据集，从原始数据集中复制样本。感谢您的回复！我是这样想的，但可能会有问题，因为1混淆矩阵将用于更大的数据集，而不是我需要的实际样本量，2这是全国代表性的数据，因此，这样做将创建数以亿计而不是几千计的数据集，并且在内存有限的情况下很难快速得到答案