Statistics 如何从非常大的数据集中采样较小的数据集？_Statistics_Data Analysis

Statistics 如何从非常大的数据集中采样较小的数据集？

statistics

Statistics 如何从非常大的数据集中采样较小的数据集？,statistics,data-analysis,Statistics,Data Analysis,我有一个非常大的数据集，其维数为（203000 x 150），其中一些列（属性）有大量缺失值，用NA表示。我需要从中取样一个较小的数据集，以便在我的计算机上运行测试。关于如何最好地做到这一点，有什么建议吗？我对这个领域很陌生，因此没有太多的专业知识谢谢，你想做什么？“运行测试”是非常不具体的。此外，203000 x 150对于今天的计算机来说也不是“非常大”。这是一个关于采样理论的问题（在这种情况下，它属于stats.SE站点），还是关于现有软件中的实现（在这种情况下，您需要指出可供您使用

我有一个非常大的数据集，其维数为（203000 x 150），其中一些列（属性）有大量缺失值，用NA表示。我需要从中取样一个较小的数据集，以便在我的计算机上运行测试。关于如何最好地做到这一点，有什么建议吗？我对这个领域很陌生，因此没有太多的专业知识

谢谢，

你想做什么？“运行测试”是非常不具体的。此外，203000 x 150对于今天的计算机来说也不是“非常大”。这是一个关于采样理论的问题（在这种情况下，它属于stats.SE站点），还是关于现有软件中的实现（在这种情况下，您需要指出可供您使用的包…然后它仍然属于stackoverflow站点）？不是。我只是想从这个数据集中得到一个更小的数据集。@deinst。。是的，我现在无法使用高端电脑。不幸的是，我的笔记本电脑无法处理这些数据。