Python 3.x 如何在中按类别读取数据以分离变量包

Python 3.x 如何在中按类别读取数据以分离变量包,python-3.x,pandas,dataframe,Python 3.x,Pandas,Dataframe,在RFInput.xlsx的sheetname=“paraList”中,我有一个参数列表,需要从Rawdata中提取这些参数的数据。在paraList中,第一行是变量的名称,在第二行中,我将每个变量的类别标记为Y或N。我想将Y个类别变量数据读入x_Y,将N个类别变量数据读入x_N import pandas as pd import numpy as np import matplotlib.pyplot as plt from scipy import stats dataFileName='

在RFInput.xlsx的sheetname=“paraList”中,我有一个参数列表,需要从Rawdata中提取这些参数的数据。在paraList中,第一行是变量的名称,在第二行中,我将每个变量的类别标记为Y或N。我想将Y个类别变量数据读入x_Y,将N个类别变量数据读入x_N

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
dataFileName='RFInput.xlsx'
sheetName='Rawdata'
sheetNamePara='paraList'
dataRaw=pd.read_excel(dataFileName, sheetname = sheetName)
datapara=pd.read_excel(dataFileName, sheetname = sheetNamePara)

noData=len(dataRaw)
import matplotlib.pylab as plt
from sklearn.cross_validation import train_test_split
from sklearn.cross_validation import cross_val_score
from sklearn.preprocessing import StandardScaler


labels = datapara
x = dataRaw[labels]
y = dataRaw['classVariable']

你有什么错误吗?哪一行?错误说明了什么?如何按类别(N或Y)分离变量。然后将N个类型变量的数据提取到x_N,Y个类型变量的数据提取到x_Y。我不知道如何将它们分开,你能给我看一下
dataRaw
datapara
中的前10条记录吗?请参阅以更好地理解我的要求。这根本没有帮助。试着回答,我看不到你的问题中有4列和2行。
classVariable   Category    Group Category.pare Status.dist
N                 N                Y               N