Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/19.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 在某些条件下,将1到3之间的随机值添加到数据帧的列中_Python_Python 3.x_Dataframe - Fatal编程技术网

Python 在某些条件下,将1到3之间的随机值添加到数据帧的列中

Python 在某些条件下,将1到3之间的随机值添加到数据帧的列中,python,python-3.x,dataframe,Python,Python 3.x,Dataframe,我想生成一个数据框架,涉及三个行业、100名投资者和2000家公司,涉及50000笔不同的交易。所以,我有50000行和四列,包括交易日期 我在数据集中随机分配了100名投资者和2000家公司进行所有交易 我的问题是,我需要通过考虑这一过程应该具备的几个条件来确定每笔交易的行业。1) 如果一家公司随机分配到一个行业,该公司应在整个数据集中保持在同一个行业。2) 所有投资者至少投资于一个行业,15名投资者至少投资于两个行业,4名投资者投资于所有三个行业。我不知道如何才能做到这一点。这似乎是两个独立

我想生成一个数据框架,涉及三个行业、100名投资者和2000家公司,涉及50000笔不同的交易。所以,我有50000行和四列,包括交易日期

我在数据集中随机分配了100名投资者和2000家公司进行所有交易


我的问题是,我需要通过考虑这一过程应该具备的几个条件来确定每笔交易的行业。1) 如果一家公司随机分配到一个行业,该公司应在整个数据集中保持在同一个行业。2) 所有投资者至少投资于一个行业,15名投资者至少投资于两个行业,4名投资者投资于所有三个行业。我不知道如何才能做到这一点。

这似乎是两个独立的问题

对于1,一个想法是将公司名称散列,然后这将为您提供一个确定的方法来设置哪个公司进入哪个行业

对于2,一个想法是使用置换函数。例如,您可以使用
numpy.shuffle
其中前4个属于所有3个,然后下15个属于2的随机子集。。。等等等等

然后,您可以根据所有这些信息生成表,并使用联接来连接最终的表,在这里,您最初只需要从交易日期、公司和交易信息开始


(这只是一个开始)

这似乎是两个独立的问题

对于1,一个想法是将公司名称散列,然后这将为您提供一个确定的方法来设置哪个公司进入哪个行业

对于2,一个想法是使用置换函数。例如,您可以使用
numpy.shuffle
其中前4个属于所有3个,然后下15个属于2的随机子集。。。等等等等

然后,您可以根据所有这些信息生成表,并使用联接来连接最终的表,在这里,您最初只需要从交易日期、公司和交易信息开始

(这只是一个开始)