Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/user-interface/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Statistics 如何从非常大的数据集中采样较小的数据集?_Statistics_Data Analysis - Fatal编程技术网

Statistics 如何从非常大的数据集中采样较小的数据集?

Statistics 如何从非常大的数据集中采样较小的数据集?,statistics,data-analysis,Statistics,Data Analysis,我有一个非常大的数据集,其维数为(203000 x 150),其中一些列(属性)有大量缺失值,用NA表示。我需要从中取样一个较小的数据集,以便在我的计算机上运行测试。 关于如何最好地做到这一点,有什么建议吗? 我对这个领域很陌生,因此没有太多的专业知识 谢谢,你想做什么?“运行测试”是非常不具体的。此外,203000 x 150对于今天的计算机来说也不是“非常大”。这是一个关于采样理论的问题(在这种情况下,它属于stats.SE站点),还是关于现有软件中的实现(在这种情况下,您需要指出可供您使用

我有一个非常大的数据集,其维数为(203000 x 150),其中一些列(属性)有大量缺失值,用NA表示。我需要从中取样一个较小的数据集,以便在我的计算机上运行测试。 关于如何最好地做到这一点,有什么建议吗? 我对这个领域很陌生,因此没有太多的专业知识


谢谢,

你想做什么?“运行测试”是非常不具体的。此外,203000 x 150对于今天的计算机来说也不是“非常大”。这是一个关于采样理论的问题(在这种情况下,它属于stats.SE站点),还是关于现有软件中的实现(在这种情况下,您需要指出可供您使用的包…然后它仍然属于stackoverflow站点)?不是。我只是想从这个数据集中得到一个更小的数据集。@deinst。。是的,我现在无法使用高端电脑。不幸的是,我的笔记本电脑无法处理这些数据。