R 如何基于其他数据集的变量分布匹配数据集?
假设我有两个变量相似但分布不同的数据集。在下面的示例中,数据集R 如何基于其他数据集的变量分布匹配数据集?,r,distribution,R,Distribution,假设我有两个变量相似但分布不同的数据集。在下面的示例中,数据集a的变量var1的平均值为10,标准差为4。数据集b也有变量var1,但平均值为8,标准差为4 a <- data.frame(id=1:500,var1=rnorm(500,10,4),type="a") b <- data.frame(id=1:300,var1=rnorm(300,8,4),type="b") rbind(a,b) %>% ggplot(aes(x
a
的变量var1
的平均值为10,标准差为4。数据集b
也有变量var1
,但平均值为8,标准差为4
a <- data.frame(id=1:500,var1=rnorm(500,10,4),type="a")
b <- data.frame(id=1:300,var1=rnorm(300,8,4),type="b")
rbind(a,b) %>%
ggplot(aes(x=type,y=var1)) +
geom_boxplot()
a要对其进行过滤还是重新采样nrow(b)
?当a和b为正态分布时,它是否特别适用?仅适用于过滤器。当a和b为正态分布时,则不明确。