Python:在2个数据集中拆分数据集
给定两个数据集,训练和测试,我想将训练数据集分为xtrain和ytrain,并将测试分为xtest和ytest。我有八度音阶的代码Python:在2个数据集中拆分数据集,python,python-3.x,numpy,Python,Python 3.x,Numpy,给定两个数据集,训练和测试,我想将训练数据集分为xtrain和ytrain,并将测试分为xtest和ytest。我有八度音阶的代码 X_tr = D_tr(:, 1:end-1); y_tr = D_tr(:, end); X_ts = D_ts(:, 1:end-1); y_ts = D_ts(:, end); 但无法理解如何将其转换为python使用: 演示:如何使用np拆分数据集(水平)。拆分: In [68]: TR = np.random.randint(10, size=(5,5
X_tr = D_tr(:, 1:end-1);
y_tr = D_tr(:, end);
X_ts = D_ts(:, 1:end-1);
y_ts = D_ts(:, end);
但无法理解如何将其转换为python使用:
演示:如何使用
np拆分数据集(水平)。拆分:
In [68]: TR = np.random.randint(10, size=(5,5))
In [69]: TR
Out[69]:
array([[2, 9, 9, 0, 3],
[5, 5, 6, 0, 3],
[7, 1, 6, 1, 0],
[5, 0, 2, 0, 4],
[2, 5, 9, 4, 2]])
In [70]: X_tr, y_tr = np.split(TR, [-1], axis=1)
In [71]: X_tr
Out[71]:
array([[2, 9, 9, 0],
[5, 5, 6, 0],
[7, 1, 6, 1],
[5, 0, 2, 0],
[2, 5, 9, 4]])
In [72]: y_tr
Out[72]:
array([[3],
[3],
[0],
[4],
[2]])
PS同样的技术将用于分割测试数据集使用:
演示:如何使用np拆分数据集(水平)。拆分:
In [68]: TR = np.random.randint(10, size=(5,5))
In [69]: TR
Out[69]:
array([[2, 9, 9, 0, 3],
[5, 5, 6, 0, 3],
[7, 1, 6, 1, 0],
[5, 0, 2, 0, 4],
[2, 5, 9, 4, 2]])
In [70]: X_tr, y_tr = np.split(TR, [-1], axis=1)
In [71]: X_tr
Out[71]:
array([[2, 9, 9, 0],
[5, 5, 6, 0],
[7, 1, 6, 1],
[5, 0, 2, 0],
[2, 5, 9, 4]])
In [72]: y_tr
Out[72]:
array([[3],
[3],
[0],
[4],
[2]])
PS同样的技术将用于分割测试数据集如果只给出一个csv文件或我们只加载一个数据集,这将分割。但这里有两个单独的csv文件,一个用于培训,另一个用于测试。@ManikaMaheshwari,请在更新的回答中查看一个小演示如果只提供一个csv文件或我们只加载一个数据集,这将分开。但这里有两个单独的csv文件,一个用于培训,另一个用于测试。@ManikaMaheshwari,请在更新的答案中查看一个小演示