Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/332.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 我如何创建一个新的df,其中只包含转换为假人的变量?_Python_Pandas_Dataframe - Fatal编程技术网

Python 我如何创建一个新的df,其中只包含转换为假人的变量?

Python 我如何创建一个新的df,其中只包含转换为假人的变量?,python,pandas,dataframe,Python,Pandas,Dataframe,这是我的数据的csv文件的前5行: df=学校;性别;年龄;地址;家庭规模;Pstatus;梅杜;费杜;Mjob;Fjob;理性;守护者旅行时间;学习时间;失败;学校督导;法姆苏普;支付;活动;婴儿室较高的;互联网浪漫的;法姆雷尔;自由时间;傻瓜;Dalc;沃尔克;卫生;缺席;G1;G2;G3“GP”;“F”;18;“U”;“GT3”;“A”;4.4.“在家”;“教师”;“课程”;“母亲”;2.2.0;“是”;“不”;“不”;“不”;“是”;“是”;“不”;“不”;4.3.4.1.1.3.6."

这是我的数据的csv文件的前5行:

df=学校;性别;年龄;地址;家庭规模;Pstatus;梅杜;费杜;Mjob;Fjob;理性;守护者旅行时间;学习时间;失败;学校督导;法姆苏普;支付;活动;婴儿室较高的;互联网浪漫的;法姆雷尔;自由时间;傻瓜;Dalc;沃尔克;卫生;缺席;G1;G2;G3“GP”;“F”;18;“U”;“GT3”;“A”;4.4.“在家”;“教师”;“课程”;“母亲”;2.2.0;“是”;“不”;“不”;“不”;“是”;“是”;“不”;“不”;4.3.4.1.1.3.6."5";"6";6“GP”;“F”;17;“U”;“GT3”;“T”;1.1.“在家”;“其他”;“课程”;“父亲”;1.2.0;“不”;“是”;“不”;“不”;“不”;“是”;“是”;“不”;5.3.3.1.1.3.4."5";"5";6“GP”;“F”;15;“U”;“LE3”;“T”;1.1.“在家”;“其他”;“其他”;“母亲”;1.2.3.“是”;“不”;“是”;“不”;“是”;“是”;“是”;“不”;4.3.2.2.3.3.10;"7";"8";10“GP”;“F”;15;“U”;“GT3”;“T”;4.2.“健康”;“服务”;“家”;“母亲”;1.3.0;“不”;“是”;“是”;“是”;“是”;“是”;“是”;“是”;3.2.2.1.1.5.2."15";"14";15

df.columns=df.columns.str.title()

将numpy作为np导入

来自sklearn.model\u选择导入列车测试\u分割

将statsmodels.api导入为sm

dummies=pd.get_dummies(df['School','Sex','Address','Famsize','Pstatus','Mjob','Fjob','Reason','Guardian','Schoolsup','Famsup','Paid','Activities','tutory','Higher','Internet','romatic']],drop_first=True)

显示(dummies.head())

df1=df.join(傻瓜)

df1=df1.drop(['School','Sex','Address','Famsize','Pstatus','Mjob','Fjob','Reason','Guardian','Schoolsup','Famsup','Paid','Activities','托儿所','Higher','Internet','romatic'])

KeyError:“['School''Sex''Address''Famsize''Pstatus''Mjob''Fjob''Reason''Guardian'\n'Schoolsup''Famsup''Paid''Activities''托儿所''Higher''Internet'\n'romatic']未在axis中找到”

将原始变量虚拟变量连接在一起后,我想删除没有0和1的原始变量我该怎么做?

可能
df1.drop(..,axis=1)
?顺便说一句,你能用带“`”的代码围栏来格式化你的代码吗?