Python 训练和验证数据集的拆分

Python 训练和验证数据集的拆分,python,dataset,Python,Dataset,我需要将我的训练数据(80-20)拆分为验证数据,拆分的子数据集不是随机的,而是始终相同的 目前我使用这个代码 from sklearn.model_selection import train_test_split X_train, X_val, Y_train, Y_val = train_test_split(X, Y, test_size=0.2) 但是分割的子数据集总是随机的,而且从不相同。我希望它是随机的,但当我再次运行代码时,应该出现相同的值(类似于np.random.seed)

我需要将我的训练数据(80-20)拆分为验证数据,拆分的子数据集不是随机的,而是始终相同的

目前我使用这个代码

from sklearn.model_selection import train_test_split
X_train, X_val, Y_train, Y_val = train_test_split(X, Y, test_size=0.2)
但是分割的子数据集总是随机的,而且从不相同。我希望它是随机的,但当我再次运行代码时,应该出现相同的值(类似于np.random.seed)

有没有办法做到这一点?

train\u test\u split()
有一个
random\u state
参数。如果为其指定整数值,结果将始终相同:

from sklearn.model_selection import train_test_split
X_train, X_val, Y_train, Y_val = train_test_split(X, Y, test_size=0.2, random_state=1)