Python 我如何创建一个新的df,其中只包含转换为假人的变量?
这是我的数据的csv文件的前5行:Python 我如何创建一个新的df,其中只包含转换为假人的变量?,python,pandas,dataframe,Python,Pandas,Dataframe,这是我的数据的csv文件的前5行: df=学校;性别;年龄;地址;家庭规模;Pstatus;梅杜;费杜;Mjob;Fjob;理性;守护者旅行时间;学习时间;失败;学校督导;法姆苏普;支付;活动;婴儿室较高的;互联网浪漫的;法姆雷尔;自由时间;傻瓜;Dalc;沃尔克;卫生;缺席;G1;G2;G3“GP”;“F”;18;“U”;“GT3”;“A”;4.4.“在家”;“教师”;“课程”;“母亲”;2.2.0;“是”;“不”;“不”;“不”;“是”;“是”;“不”;“不”;4.3.4.1.1.3.6."
df=学校;性别;年龄;地址;家庭规模;Pstatus;梅杜;费杜;Mjob;Fjob;理性;守护者旅行时间;学习时间;失败;学校督导;法姆苏普;支付;活动;婴儿室较高的;互联网浪漫的;法姆雷尔;自由时间;傻瓜;Dalc;沃尔克;卫生;缺席;G1;G2;G3“GP”;“F”;18;“U”;“GT3”;“A”;4.4.“在家”;“教师”;“课程”;“母亲”;2.2.0;“是”;“不”;“不”;“不”;“是”;“是”;“不”;“不”;4.3.4.1.1.3.6."5";"6";6“GP”;“F”;17;“U”;“GT3”;“T”;1.1.“在家”;“其他”;“课程”;“父亲”;1.2.0;“不”;“是”;“不”;“不”;“不”;“是”;“是”;“不”;5.3.3.1.1.3.4."5";"5";6“GP”;“F”;15;“U”;“LE3”;“T”;1.1.“在家”;“其他”;“其他”;“母亲”;1.2.3.“是”;“不”;“是”;“不”;“是”;“是”;“是”;“不”;4.3.2.2.3.3.10;"7";"8";10“GP”;“F”;15;“U”;“GT3”;“T”;4.2.“健康”;“服务”;“家”;“母亲”;1.3.0;“不”;“是”;“是”;“是”;“是”;“是”;“是”;“是”;3.2.2.1.1.5.2."15";"14";15
df.columns=df.columns.str.title()
将numpy作为np导入
来自sklearn.model\u选择导入列车测试\u分割
将statsmodels.api导入为sm
dummies=pd.get_dummies(df['School','Sex','Address','Famsize','Pstatus','Mjob','Fjob','Reason','Guardian','Schoolsup','Famsup','Paid','Activities','tutory','Higher','Internet','romatic']],drop_first=True)
显示(dummies.head())
df1=df.join(傻瓜)
df1=df1.drop(['School','Sex','Address','Famsize','Pstatus','Mjob','Fjob','Reason','Guardian','Schoolsup','Famsup','Paid','Activities','托儿所','Higher','Internet','romatic'])
KeyError:“['School''Sex''Address''Famsize''Pstatus''Mjob''Fjob''Reason''Guardian'\n'Schoolsup''Famsup''Paid''Activities''托儿所''Higher''Internet'\n'romatic']未在axis中找到”
将原始变量和虚拟变量连接在一起后,我想删除没有0和1的原始变量我该怎么做?可能df1.drop(..,axis=1)
?顺便说一句,你能用带“`”的代码围栏来格式化你的代码吗?