Python 如何为pd.util.testing.makeDataFrame()设置随机种子?
编辑:我发现这个问题与Jupyter笔记本电脑有关。我不能全局设置种子并在每次跑步中获得相同的结果。我必须使用Python 如何为pd.util.testing.makeDataFrame()设置随机种子?,python,pandas,Python,Pandas,编辑:我发现这个问题与Jupyter笔记本电脑有关。我不能全局设置种子并在每次跑步中获得相同的结果。我必须使用pd.util.testing.makeDataFrame()在代码单元格中设置随机种子 原始问题: 我正在尝试设置随机状态,以便能够为使用pandas的pd.util.testing.makeDataFrame()生成的数据帧获得可再现的结果 我已经为Python和NumPy设置了随机种子。是否有另一个随机种子,我可以设置,以获得可重复的结果 seed = 34 # python i
pd.util.testing.makeDataFrame()
在代码单元格中设置随机种子
原始问题:
我正在尝试设置随机状态,以便能够为使用pandas的pd.util.testing.makeDataFrame()
生成的数据帧获得可再现的结果
我已经为Python和NumPy设置了随机种子。是否有另一个随机种子,我可以设置,以获得可重复的结果
seed = 34
# python
import random
random.seed(seed)
# numpy
np.random.seed(seed)
我已经搜索过了,但没有结果。如果您想使用panda的随机种子测试框架,请尝试以下方法:
from numpy import random, prod, str_
from numpy.random import randn
import pandas.util.testing as test
from pandas import DataFrame, Series
def rand_df(N=30, K=4, seed=0, nchars=10):
random.seed(seed)
index = (
random.choice(test.RANDS_CHARS, size=nchars * prod(N))
.view((str_, nchars))
.reshape(N)
).astype('O')
return DataFrame({c: Series(randn(N), index=index) for c in test.getCols(K)})
a = rand_df()
b = rand_df()
print(a == b)
我发现这个问题与Jupyter笔记本电脑有关。我无法在全球范围内为笔记本设定种子,并在每次跑步中获得相同的结果。我必须使用
pd.util.testing.makeDataFrame()
在代码单元格中设置随机种子
帮助确认。我不确定您是否可以这样做。源代码中的这一行()表示数据帧是从
testing.py
范围内的随机numpy矩阵创建的。