Python 将SVM文件矩阵拆分为4部分
我有两个文件,分为训练集和测试集Python 将SVM文件矩阵拆分为4部分,python,numpy,scikit-learn,Python,Numpy,Scikit Learn,我有两个文件,分为训练集和测试集 traindata = load_svmlight_file("training") testdata = load_svmlight_file("testing") Xtrain = traindata[0].todense() ytrain = traindata[1] Xtest = testdata[0].todense() ytest = testdata[1] 我想将Xtest和ytest分为4部分: Xtest1,ytest1 Xtest2,yt
traindata = load_svmlight_file("training")
testdata = load_svmlight_file("testing")
Xtrain = traindata[0].todense()
ytrain = traindata[1]
Xtest = testdata[0].todense()
ytest = testdata[1]
我想将Xtest和ytest分为4部分:
Xtest1,ytest1
Xtest2,ytest2,
Xtest3,ytest3,
Xtest4,ytest4
我的直觉是使用sklearn.train\u test\u split,但我不确定。执行此操作的最佳方法是什么?您可以使用以下方法:
我使用了np.random.permutation
来防止数据被随机分割。如果您只想将其拆分为连续的部分,可以删除np.random.permutation
您可以使用以下方法执行此操作:
我使用了np.random.permutation
来防止数据被随机分割。如果只想将其拆分为连续的部分,可以删除np.random.permutation
import numpy as np
test=np.arange(21)
xtest1,xtest2,xtest3,xtest4 = np.array_split(np.random.permutation(test),4)