Stata 如何在不替换的情况下进行比例分层抽样？_Stata_Sampling

Stata 如何在不替换的情况下进行比例分层抽样？

stata

Stata 如何在不替换的情况下进行比例分层抽样？,stata,sampling,Stata,Sampling,我想根据三个地层变量在Stata 13中选择我的样本，共有12个地层-两个地层；部门-三层；无形强度-两个层次。选择应成比例，无需更换但是，我只能找到不成比例的选择命令，例如选择每个层的x% 有人能帮我解决这个问题吗问题是，地层可能重叠。因此，您可能需要在初稿之后重新平衡样本现在的问题是，如何实现这一点。最终样本应尽可能代表人口比例感谢您的讨论。我想我知道我的问题出在哪里了 gssample命令可以根据不同的变量选择地层。因此，我认为我必须定义三个不同的阶层变量。但解决方案应该更简单共

我想根据三个地层变量在Stata 13中选择我的样本，共有12个地层-两个地层；部门-三层；无形强度-两个层次。选择应成比例，无需更换

但是，我只能找到不成比例的选择命令，例如选择每个层的x%

有人能帮我解决这个问题吗

问题是，地层可能重叠。因此，您可能需要在初稿之后重新平衡样本

现在的问题是，如何实现这一点。最终样本应尽可能代表人口比例

感谢您的讨论。我想我知道我的问题出在哪里了

gssample命令可以根据不同的变量选择地层。因此，我认为我必须定义三个不同的阶层变量。但解决方案应该更简单

共有12个层次，第一部门的高强度大企业，第一部门的高强度小企业，依此类推，样本中的每个企业都属于其中一个层次

我所要做的就是创建一个变量strataident，其值从1到12，用于识别不同的地层。我这样做是为了人口数据集，所以每个阶层的公司数量代表人口。下面的代码将为我提供一个具有代表性的分层随机样本

G样本10，百分之地层工作

此命令也可以使用，而且更简单，请参见中的示例：

除了在每个阶层中选择相同的分数外，什么是比例抽样？至少在我的理解中，比例意味着；如果我错了，请纠正我。您根据人口分布情况选择每个阶层的受试者，例如，35%的人口是大公司，因此最终35%的大公司应该在您的样本中。在这种情况下，分层是不相关的。我认为这里的混乱可能是一个统计谬误，你想要一个随机样本是人口的微型复制品。在《国际统计评论1979f》中查找Kruskal和Mosteller的一系列论文。请看一下这篇：其他GSSample功能部分。这里它说的是：Gsample还可以进行分层和整群抽样，这些可以与权重选项相结合。这是统计上的胡说八道还是我弄错了？请让你的问题独立起来，不要依赖于阅读外部资料。更重要的是，你的问题现在更多的是统计性的，而不是编程性的，在我看来，这在某种程度上是离题的。根据定义，分层抽样中的分层划分了人口，并且没有重叠。我写的是错的。我的意思是分层是多维度的，每个个体在每个维度上都是一个层次的一部分；否则，所有线程将无限期地保持打开状态，因为其他线程可能希望添加更多答案或编辑它们，具体取决于声誉。你可以接受自己的答案。谢谢，我会保持开放。谢谢，我删除了结束问题

gsample 10, percent wor strata(size sector intensity)