R 相关计数变量和连续变量之间的模拟数据
有人知道我怎么可能用计数变量和连续变量之间的相关性来模拟数据吗?现在,我最好的想法是转换count变量,使其近似正常,然后使用R代码模拟数据:R 相关计数变量和连续变量之间的模拟数据,r,count,simulation,R,Count,Simulation,有人知道我怎么可能用计数变量和连续变量之间的相关性来模拟数据吗?现在,我最好的想法是转换count变量,使其近似正常,然后使用R代码模拟数据: set.seed(2018) x = rnorm(n = 1000, mean = 0, sd = 1) y = rnorm(n = 1000, mean = .29*x, sqrt(1-.3^2)) cor(x,y) 然而,我真的认为如果我真的能把Y作为一个计数变量(因为它们通常是右偏的),那就更好了。另外,我希望能够指定x和y之间的
set.seed(2018)
x = rnorm(n = 1000, mean = 0, sd = 1)
y = rnorm(n = 1000, mean = .29*x, sqrt(1-.3^2))
cor(x,y)
然而,我真的认为如果我真的能把Y作为一个计数变量(因为它们通常是右偏的),那就更好了。另外,我希望能够指定x和y之间的特定相关性。例如,模拟x和y之间具有0.5相关性的数据等
编辑:我仍在寻求帮助您可以使用
runif
模拟连续变量,然后将结果作为rpois
的lambda(rate)参数输入:
set.seed(1)
我现在意识到,从我的问题来看,这还不清楚:我为什么要这样做,是因为能够提前指定相关性。我不确定我怎样才能用你的方法模拟数据,比如说0.5的相关性。我将尝试编辑原始帖子,以澄清这一点。