Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/drupal/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何以近似相等的比例生成随机数据集_Python - Fatal编程技术网

Python 如何以近似相等的比例生成随机数据集

Python 如何以近似相等的比例生成随机数据集,python,Python,如何生成包含8列和50000行的随机数据集。每一列必须是一个分类变量(犬种),具有3个级别(例如,颜色),使用Python可以得到大致相等的比例。可能有多少唯一行(即类别级别的排列) data = np.empty(50000, 8) data[:,0] = [np.random.choice(col0_options) for i in range(50000)] # do this for all columns ... data[:,7] = [np.random.choice(col7_

如何生成包含8列和50000行的随机数据集。每一列必须是一个分类变量(犬种),具有3个级别(例如,颜色),使用Python可以得到大致相等的比例。可能有多少唯一行(即类别级别的排列)

data = np.empty(50000, 8)
data[:,0] = [np.random.choice(col0_options) for i in range(50000)]
# do this for all columns ...
data[:,7] = [np.random.choice(col7_options) for i in range(50000)]
如果您想减少硬编码,可以将每个选项列表存储在dict中,如
{0:col0\u options,…,7:col7\u options}
,然后执行以下操作:

options = {0: col0_options, ..., 7: col7_options}
data = np.empty(50000, 8)
for i in range(8):
    data[:,i] = [np.random.choice(options[i]) for i in range(50000)]
由于每列有8列和3个值,因此有3^8个独特的可能性