Math 考虑累积频率因素的随机数函数

Math 考虑累积频率因素的随机数函数,math,statistics,frequency,Math,Statistics,Frequency,和名字的出现提供了累计频率和频率。如何获得一个随机名称,并使其被选择的可能性与现实世界中发生的可能性相同?只需生成一个0-100范围内的随机实数,并在累积频率数据集中查找相应的条目 例如,假设您的随机数为x=19.41。查看表格(按累计频率排序),找到第一个值大于或等于x WALLACE 0.081 19.315 106 WOODS 0.080 19.395 107 COLE 0.080 19.476 108 WEST

和名字的出现提供了
累计频率
频率
。如何获得一个随机名称,并使其被选择的可能性与现实世界中发生的可能性相同?

只需生成一个0-100范围内的随机实数,并在累积频率数据集中查找相应的条目

例如,假设您的随机数为
x=19.41
。查看表格(按累计频率排序),找到第一个值大于或等于
x

WALLACE        0.081 19.315    106
WOODS          0.080 19.395    107
COLE           0.080 19.476    108
WEST           0.080 19.555    109
JORDAN         0.078 19.634    110

在本例中,获得“COLE”

只需在0-100范围内生成一个随机实数,并在累积频率数据集中查找相应的条目

例如,假设您的随机数为
x=19.41
。查看表格(按累计频率排序),找到第一个值大于或等于
x

WALLACE        0.081 19.315    106
WOODS          0.080 19.395    107
COLE           0.080 19.476    108
WEST           0.080 19.555    109
JORDAN         0.078 19.634    110

在本例中,您得到“COLE”

它是否大于或等于X?第一个名字是Smith,累积频率为1.006,如果我得到0.6584,我该怎么做?这也让人困惑,因为在链接数据集中,cumfreq的最大值是90.483,而不是100。这意味着对于90.483-100.000(大约10%)之间的所有随机数,我应该显示AARDEMA?那不可能是对的。我这辈子从来没有见过一个AARDEMA。@Evan最后10%的名字都是非常罕见的,如果把它们全部放在名单上,下载起来可能需要千兆字节。你刚刚得到了90.483%最常见的名字。它会大于或等于X吗?第一个名字是Smith,累积频率为1.006,如果我得到0.6584,我该怎么做?这也让人困惑,因为在链接数据集中,cumfreq的最大值是90.483,而不是100。这意味着对于90.483-100.000(大约10%)之间的所有随机数,我应该显示AARDEMA?那不可能是对的。我这辈子从来没有见过一个AARDEMA。@Evan最后10%的名字都是非常罕见的,如果把它们全部放在名单上,下载起来可能需要千兆字节。你刚刚得到了90.483%的最常见的名字。