Python 随机森林:重采样时对单个观测值进行加权

Python 随机森林:重采样时对单个观测值进行加权,python,r,scikit-learn,random-forest,Python,R,Scikit Learn,Random Forest,我目前正在使用一个全国代表性数据集上的随机森林,每个观测值都包含概率权重,希望我能在引导过程中使用这些权重 我主要是一个使用randomForest软件包的R用户,经过一些调查,我发现虽然可以对特定的类进行加权,但似乎没有一种方法可以对特定的观察结果进行加权。请参见第一个答案的注释 另一方面,在python中实现scikit的随机林有一个示例_-weight参数,它以我需要的方式对观察值进行加权 我只是好奇地想知道:是否有一种方法可以使用现有的R包对R中的随机林的观测值进行加权,或者我是否应该转

我目前正在使用一个全国代表性数据集上的随机森林,每个观测值都包含概率权重,希望我能在引导过程中使用这些权重

我主要是一个使用randomForest软件包的R用户,经过一些调查,我发现虽然可以对特定的类进行加权,但似乎没有一种方法可以对特定的观察结果进行加权。请参见第一个答案的注释

另一方面,在python中实现scikit的随机林有一个示例_-weight参数,它以我需要的方式对观察值进行加权


我只是好奇地想知道:是否有一种方法可以使用现有的R包对R中的随机林的观测值进行加权,或者我是否应该转到Python来完成这项任务?

我没有看到任何迹象表明可以直接使用随机林来完成这项工作。如果您想对样本进行加权,可以手动创建一个新的数据集,从原始数据集中复制样本。感谢您的回复!我是这样想的,但可能会有问题,因为1混淆矩阵将用于更大的数据集,而不是我需要的实际样本量,2这是全国代表性的数据,因此,这样做将创建数以亿计而不是几千计的数据集,并且在内存有限的情况下很难快速得到答案