Python 如何将名为(my_data2)的数据表划分为两个示例

Python 如何将名为(my_data2)的数据表划分为两个示例,python,numpy,pandas,Python,Numpy,Pandas,我想把我的数据表my_data2分成两个样本,分别是learning sample和test sample。如何在我表格的第一部分——第一个样本——应用逻辑回归,然后在第二部分应用预测?非常感谢。 这是我的编码 import numpy as np from statsmodels.formula.api import logit FNAME2 ="C:/Users/lenovo/Desktop/Nouveau dossier (2)/table.csv" FinalTableau=np.sa

我想把我的数据表my_data2分成两个样本,分别是learning sample和test sample。如何在我表格的第一部分——第一个样本——应用逻辑回归,然后在第二部分应用预测?非常感谢。 这是我的编码

import numpy as np
from statsmodels.formula.api import logit

FNAME2 ="C:/Users/lenovo/Desktop/Nouveau dossier (2)/table.csv"
FinalTableau=np.savetxt(FNAME2,my_data[index_to_use] , delimiter=",")
my_data2 = np.genfromtxt (FNAME2, delimiter = ',')

x= my_data2 [:,1]
a= my_data2[:,3]
#x with values 1 and 2
print x

#converts my binary data series from (1, 2) to (0,1)
x= my_data[:, 1] - 1
print x

form = 'x ~ a'
affair_model = logit (form, my_data2)

affair_result = affair_model.fit ()

print affair_result.summary ()
print affair_result.predict()
要将my_data2拆分为大小大致相同的两个数组,请执行以下操作:

N = len(my_data2)//2
learning_sample, test_sample = my_data2[:N], my_data2[N:]
比如说,

import numpy as np
from statsmodels.formula.api import logit

FNAME2 = "C:/Users/lenovo/Desktop/Nouveau dossier (2)/table.csv"
FinalTableau = np.savetxt(FNAME2, my_data[index_to_use], delimiter=",")
my_data2 = np.genfromtxt(FNAME2, delimiter=',')

# converts my binary data series from (1, 2) to (0,1)
my_data2[:, 1] -= 1  
# print my_data2

N = len(my_data2)//2
learning_sample, test_sample = my_data2[:N], my_data2[N:]
x = learning_sample[:, 1]
a = learning_sample[:, 3]
# x with values 1 and 2
print x

form = 'x ~ a'
affair_model = logit(form, learning_sample)
affair_result = affair_model.fit()

print affair_result.summary()
print affair_result.predict()

是的,对不起,正确的句子是x=my_data2[:,1]-1。它有助于恢复第二列。您可以先调整数据,然后再将其拆分为两部分。我已经编辑了上面的代码来说明我的意思。好吧,但是我如何恢复我的数据2[:N]的第二列的值呢?所以如果我要恢复test_sample的第二列,我也会使x=test_sample[:,1]?当我发出这个命令时,我会得到错误!!!