Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/66.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/csharp-4.0/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
“如何解决错误”;观察太少。”;在R中使用ROSE来平衡数据时?_R_Statistical Sampling - Fatal编程技术网

“如何解决错误”;观察太少。”;在R中使用ROSE来平衡数据时?

“如何解决错误”;观察太少。”;在R中使用ROSE来平衡数据时?,r,statistical-sampling,R,Statistical Sampling,我尝试使用R上的ROSE库来重新平衡数据集中的目标变量。 这是我的数据集信息 我的原始数据集总共有132056条记录 在目标变量中,共有279例(0.21%)为轻度 目标变量中主要类别共有131777例(99.79%) 我想对数据集进行欠采样,使次要类别的百分比增加到5% 这是我的密码: df_Under <- ovun.sample(Target ~ ., data = df, method = "under", N =5580, seed = 1) 我试着用ROSE的其他方法玩,

我尝试使用R上的ROSE库来重新平衡数据集中的目标变量。 这是我的数据集信息

  • 我的原始数据集总共有132056条记录
  • 在目标变量中,共有279例(0.21%)为轻度
  • 目标变量中主要类别共有131777例(99.79%)
我想对数据集进行欠采样,使次要类别的百分比增加到5%

这是我的密码:

df_Under <- ovun.sample(Target ~ ., data = df, method = "under", N =5580, seed = 1)
我试着用ROSE的其他方法玩,比如“结束”和“两者”,但也出现了同样的错误

我如何解决这个问题


亲切问候,

我相信您希望您的代码使用
p=0.05
(5%)而不是像您那样使用
p=0.5
(50%)(这是函数的默认值),并使用
over
sample来显示少数类的样本大小,如您在帖子中所述:

df_Under <- ovun.sample(Target ~ ., data = df, method = "over", N =5580, seed = 1, p = 0.05)

data.balanced.UnderI面临同样的问题。问题实际上是数据集中的列(变量)带有NA/Nan

请在删除NA后尝试运行代码

让我知道这是否有帮助

df_Under <- ovun.sample(Target ~ ., data = df, method = "over", N =5580, seed = 1, p = 0.05)