Stata 如何在不替换的情况下进行比例分层抽样?

Stata 如何在不替换的情况下进行比例分层抽样?,stata,sampling,Stata,Sampling,我想根据三个地层变量在Stata 13中选择我的样本,共有12个地层-两个地层;部门-三层;无形强度-两个层次。选择应成比例,无需更换 但是,我只能找到不成比例的选择命令,例如选择每个层的x% 有人能帮我解决这个问题吗 问题是,地层可能重叠。因此,您可能需要在初稿之后重新平衡样本 现在的问题是,如何实现这一点。最终样本应尽可能代表人口比例 感谢您的讨论。我想我知道我的问题出在哪里了 gssample命令可以根据不同的变量选择地层。因此,我认为我必须定义三个不同的阶层变量。但解决方案应该更简单 共

我想根据三个地层变量在Stata 13中选择我的样本,共有12个地层-两个地层;部门-三层;无形强度-两个层次。选择应成比例,无需更换

但是,我只能找到不成比例的选择命令,例如选择每个层的x%


有人能帮我解决这个问题吗

问题是,地层可能重叠。因此,您可能需要在初稿之后重新平衡样本


现在的问题是,如何实现这一点。最终样本应尽可能代表人口比例

感谢您的讨论。我想我知道我的问题出在哪里了

gssample命令可以根据不同的变量选择地层。因此,我认为我必须定义三个不同的阶层变量。但解决方案应该更简单

共有12个层次,第一部门的高强度大企业,第一部门的高强度小企业,依此类推,样本中的每个企业都属于其中一个层次

我所要做的就是创建一个变量strataident,其值从1到12,用于识别不同的地层。我这样做是为了人口数据集,所以每个阶层的公司数量代表人口。下面的代码将为我提供一个具有代表性的分层随机样本

G样本10,百分之地层工作

此命令也可以使用,而且更简单,请参见中的示例:


除了在每个阶层中选择相同的分数外,什么是比例抽样?至少在我的理解中,比例意味着;如果我错了,请纠正我。您根据人口分布情况选择每个阶层的受试者,例如,35%的人口是大公司,因此最终35%的大公司应该在您的样本中。在这种情况下,分层是不相关的。我认为这里的混乱可能是一个统计谬误,你想要一个随机样本是人口的微型复制品。在《国际统计评论1979f》中查找Kruskal和Mosteller的一系列论文。请看一下这篇:其他GSSample功能部分。这里它说的是:Gsample还可以进行分层和整群抽样,这些可以与权重选项相结合。这是统计上的胡说八道还是我弄错了?请让你的问题独立起来,不要依赖于阅读外部资料。更重要的是,你的问题现在更多的是统计性的,而不是编程性的,在我看来,这在某种程度上是离题的。根据定义,分层抽样中的分层划分了人口,并且没有重叠。我写的是错的。我的意思是分层是多维度的,每个个体在每个维度上都是一个层次的一部分;否则,所有线程将无限期地保持打开状态,因为其他线程可能希望添加更多答案或编辑它们,具体取决于声誉。你可以接受自己的答案。谢谢,我会保持开放。谢谢,我删除了结束问题
gsample 10, percent wor strata(size sector intensity)