R中现有数据的正态分布随机抽样

R中现有数据的正态分布随机抽样,r,random,tidyverse,sample,normal-distribution,R,Random,Tidyverse,Sample,Normal Distribution,我有一个很大的个人数据集,他们对一些项目进行了评级(x1:x10)。每一个人。评分已合并为总分(范围为0-5)。现在,我想画两个样本量相同的子样本,其中总分有一个特定的平均值(1.5和3),并且服从正态分布。个体可能是两个子样本的一部分 为了解决这一问题,可以使用向量(总分)中概述的规格进行采样。不幸的是,我只找到了从向量中抽取随机样本的不同方法,而没有找到一种围绕特定均值进行采样的方法 编辑: 正如我所指出的,正态分布是不可能的。我不是在寻找一种方法来对二项分布进行采样(直接从数据中进行采样,

我有一个很大的个人数据集,他们对一些项目进行了评级(x1:x10)。每一个人。评分已合并为总分(范围为0-5)。现在,我想画两个样本量相同的子样本,其中总分有一个特定的平均值(1.5和3),并且服从正态分布。个体可能是两个子样本的一部分

为了解决这一问题,可以使用向量(总分)中概述的规格进行采样。不幸的是,我只找到了从向量中抽取随机样本的不同方法,而没有找到一种围绕特定均值进行采样的方法

编辑:


正如我所指出的,正态分布是不可能的。我不是在寻找一种方法来对二项分布进行采样(直接从数据中进行采样,而无需创建类似的分布和匹配)。

你不能在具有硬限制的离散尺度上获得正态分布数据。从均值介于0和5之间的正态分布中抽取的样本将围绕均值对称,将采用锥形值而不是离散值,并且包含小于零和大于5的值的非零概率

您希望您的样本包含介于0和5之间的离散值,并具有围绕平均值的中心趋势。要模拟具有特定平均值的分数,您需要使用
rbinom
二项分布中取样


get\n\u samples\u averacing\m我不是落选者,但有人可能会对你的答案产生疑问:虽然你认为正态分布是连续的而不是离散的,但你提出的解决方案忽略了OP的作用:他们的数据的子样本符合这些标准,不是新的独立二项样本。谢谢@Duckmayer。我明白你的意思。尽管如此,用引用的平均值从数据中提取一个正态分布的样本是不可能的,因此二项式将是最接近OP想要的。OP可以使用二项式从他们自己的数据中提取匹配的候选人。我本可以展示这一点,但没有示例中的数据。尽管如此,我真诚地感谢您的反馈。如果您想从数据中取样并使其按二项分布,唯一的两种方法是1)取大量样本并保留符合二项分布的样本,或2)取一个二项样本并选择与此样本得分相匹配的人群成员(如我的回答所示)。这两种方法都不是“变通方法”——它们是对数据进行采样并匹配分布的唯一有效方法。第一种方法很难,第二种方法更容易。它们在逻辑上是等价的。