Math 考虑累积频率因素的随机数函数
和名字的出现提供了Math 考虑累积频率因素的随机数函数,math,statistics,frequency,Math,Statistics,Frequency,和名字的出现提供了累计频率和频率。如何获得一个随机名称,并使其被选择的可能性与现实世界中发生的可能性相同?只需生成一个0-100范围内的随机实数,并在累积频率数据集中查找相应的条目 例如,假设您的随机数为x=19.41。查看表格(按累计频率排序),找到第一个值大于或等于x WALLACE 0.081 19.315 106 WOODS 0.080 19.395 107 COLE 0.080 19.476 108 WEST
累计频率
和频率
。如何获得一个随机名称,并使其被选择的可能性与现实世界中发生的可能性相同?只需生成一个0-100范围内的随机实数,并在累积频率数据集中查找相应的条目
例如,假设您的随机数为x=19.41
。查看表格(按累计频率排序),找到第一个值大于或等于x
WALLACE 0.081 19.315 106
WOODS 0.080 19.395 107
COLE 0.080 19.476 108
WEST 0.080 19.555 109
JORDAN 0.078 19.634 110
在本例中,获得“COLE”只需在0-100范围内生成一个随机实数,并在累积频率数据集中查找相应的条目 例如,假设您的随机数为
x=19.41
。查看表格(按累计频率排序),找到第一个值大于或等于x
WALLACE 0.081 19.315 106
WOODS 0.080 19.395 107
COLE 0.080 19.476 108
WEST 0.080 19.555 109
JORDAN 0.078 19.634 110
在本例中,您得到“COLE”它是否大于或等于X?第一个名字是Smith,累积频率为1.006,如果我得到0.6584,我该怎么做?这也让人困惑,因为在链接数据集中,cumfreq的最大值是90.483,而不是100。这意味着对于90.483-100.000(大约10%)之间的所有随机数,我应该显示AARDEMA?那不可能是对的。我这辈子从来没有见过一个AARDEMA。@Evan最后10%的名字都是非常罕见的,如果把它们全部放在名单上,下载起来可能需要千兆字节。你刚刚得到了90.483%最常见的名字。它会大于或等于X吗?第一个名字是Smith,累积频率为1.006,如果我得到0.6584,我该怎么做?这也让人困惑,因为在链接数据集中,cumfreq的最大值是90.483,而不是100。这意味着对于90.483-100.000(大约10%)之间的所有随机数,我应该显示AARDEMA?那不可能是对的。我这辈子从来没有见过一个AARDEMA。@Evan最后10%的名字都是非常罕见的,如果把它们全部放在名单上,下载起来可能需要千兆字节。你刚刚得到了90.483%的最常见的名字。