Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/78.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 用SMOTE平衡包含案例权重的不平衡数据集_R_Classification_R Caret - Fatal编程技术网

R 用SMOTE平衡包含案例权重的不平衡数据集

R 用SMOTE平衡包含案例权重的不平衡数据集,r,classification,r-caret,R,Classification,R Caret,我一直在对10万名客户进行调查,这些客户被分为几个客户群。现在,由于实际完成调查的受访者的性质,进行定性研究的研究人员应用了案例权重(也称为概率权重),并向我提供了8个类别标签中的所有客户的数据。所以我们有一个多类的问题,当然是高度不平衡的 我采取的一种方法是将这些类分解成一个成对的模型,所有这些模型都有助于最终投票。现在我的问题有两个: 我正在使用奇妙的软件包SMOTE来平衡每个模型,以解决类不平衡问题。然而,由于每个客户记录都有一个相关的案例,所以SMOTE对每个客户都一视同仁。在应用SMO

我一直在对10万名客户进行调查,这些客户被分为几个客户群。现在,由于实际完成调查的受访者的性质,进行定性研究的研究人员应用了案例权重(也称为概率权重),并向我提供了8个类别标签中的所有客户的数据。所以我们有一个多类的问题,当然是高度不平衡的

我采取的一种方法是将这些类分解成一个成对的模型,所有这些模型都有助于最终投票。现在我的问题有两个:

  • 我正在使用奇妙的软件包SMOTE来平衡每个模型,以解决类不平衡问题。然而,由于每个客户记录都有一个相关的案例,所以SMOTE对每个客户都一视同仁。在应用SMOTE之后,类现在看起来是相等的,但是如果考虑到各自的情况权重,它实际上不是。
  • 我的第二个问题与我的战略有关。我应该不必担心我的案例权重,只需在未加权的原始数据上建立分类模型,即使它不代表我想要分类到每个细分市场的总客户群
  • 我一直在使用R caret包来构建这些多个二进制分类器


    关于

    您能详细说明所使用的加权方案吗?您能详细说明所使用的加权方案吗