Python 2.7 如何有效地从Python中的一个非常大的集合中获取随机样本

Python 2.7 如何有效地从Python中的一个非常大的集合中获取随机样本,python-2.7,numpy,Python 2.7,Numpy,我试图对一些数字进行抽样,这些数字可以作为特定数据集的年收入。 我有下面的代码,它在内存中爆炸,系统挂起 np.random.choice(xrange(7500001000000000),size=254) 然后我把代码改成 np.random.choice(xrange(75100000),size=254)*10000 代码运行良好,内存较少,但性能较差。 我真的不确定是否会影响分布中的采样 我能以任何有效的方式来做吗。为什么要使用python 2?python 3比python 2使用的

我试图对一些数字进行抽样,这些数字可以作为特定数据集的年收入。 我有下面的代码,它在内存中爆炸,系统挂起

np.random.choice(xrange(7500001000000000),size=254)

然后我把代码改成
np.random.choice(xrange(75100000),size=254)*10000

代码运行良好,内存较少,但性能较差。 我真的不确定是否会影响分布中的采样


我能以任何有效的方式来做吗。

为什么要使用python 2?python 3比python 2使用的
np.random.randint(750001000000000,size=254)有什么优势吗?