Testing 如何生成准随机统计数据集?

Testing 如何生成准随机统计数据集?,testing,dataset,statistics,data-generation,Testing,Dataset,Statistics,Data Generation,我正在寻找一种工具,可以让我生成具有某些统计特性的数据集。例如,假设我想生成100万个带有x个异常值的整数,用于测试 有没有生成这样的测试数据集的工具?我不需要任何花哨的东西,只需要一些基本的功能。最简单的技术,至少在数学上最容易理解的是算法。最简单的技术,至少在数学上最容易理解,是算法。有一些工具可用于从简单概率分布生成数据。实际上,使用您正在使用的任何系统的random()功能来创建这些生成函数的一部分都非常容易。假设random()返回一个均匀分布的介于0和1之间的随机数,则只需将该随机数

我正在寻找一种工具,可以让我生成具有某些统计特性的数据集。例如,假设我想生成100万个带有x个异常值的整数,用于测试


有没有生成这样的测试数据集的工具?我不需要任何花哨的东西,只需要一些基本的功能。

最简单的技术,至少在数学上最容易理解的是算法。

最简单的技术,至少在数学上最容易理解,是算法。

有一些工具可用于从简单概率分布生成数据。实际上,使用您正在使用的任何系统的random()功能来创建这些生成函数的一部分都非常容易。假设random()返回一个均匀分布的介于0和1之间的随机数,则只需将该随机数传递给所需的任意分布,即可获得所需的随机数。如果你需要一些非常奇特的东西,你可以使用。

有一些工具可以用来从简单的概率分布生成数据。实际上,使用您正在使用的任何系统的random()功能来创建这些生成函数的一部分都非常容易。假设random()返回一个均匀分布的介于0和1之间的随机数,则只需将该随机数传递给所需的任意分布,即可获得所需的随机数。如果你需要非常花哨的东西,你可以用