R 如何基于其他数据集的变量分布匹配数据集?

R 如何基于其他数据集的变量分布匹配数据集?,r,distribution,R,Distribution,假设我有两个变量相似但分布不同的数据集。在下面的示例中,数据集a的变量var1的平均值为10,标准差为4。数据集b也有变量var1,但平均值为8,标准差为4 a <- data.frame(id=1:500,var1=rnorm(500,10,4),type="a") b <- data.frame(id=1:300,var1=rnorm(300,8,4),type="b") rbind(a,b) %>% ggplot(aes(x

假设我有两个变量相似但分布不同的数据集。在下面的示例中,数据集
a
的变量
var1
的平均值为10,标准差为4。数据集
b
也有变量
var1
,但平均值为8,标准差为4

a <- data.frame(id=1:500,var1=rnorm(500,10,4),type="a")

b <- data.frame(id=1:300,var1=rnorm(300,8,4),type="b")

rbind(a,b) %>%
  ggplot(aes(x=type,y=var1)) +
  geom_boxplot()

a要对其进行过滤还是重新采样
nrow(b)
?当a和b为正态分布时,它是否特别适用?仅适用于过滤器。当a和b为正态分布时,则不明确。