Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/345.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 无最后一个值的CSV文件到数组_Python_Neural Network_Dataset - Fatal编程技术网

Python 无最后一个值的CSV文件到数组

Python 无最后一个值的CSV文件到数组,python,neural-network,dataset,Python,Neural Network,Dataset,因此,我对Python和神经网络领域相当陌生。我编写了一些神经网络(主要是CNN),但这些只是一些测试项目。在教程等的帮助下,我完成了它们。现在我正试图编写一个简单的神经网络,通过一些“指标”预测学生的成绩。问题是“变量”不是用列分隔的。我需要将指标分为一个包含所有指标的列表,没有最后一个指标,还有一个包含最后一个指标但没有其他内容的列表。我还非常确定我需要将“是”和“否”转换为1和0 数据集:要读取csv数据: import pandas as pd df = pd.read_csv(&qu

因此,我对Python和神经网络领域相当陌生。我编写了一些神经网络(主要是CNN),但这些只是一些测试项目。在教程等的帮助下,我完成了它们。现在我正试图编写一个简单的神经网络,通过一些“指标”预测学生的成绩。问题是“变量”不是用列分隔的。我需要将指标分为一个包含所有指标的列表,没有最后一个指标,还有一个包含最后一个指标但没有其他内容的列表。我还非常确定我需要将“是”和“否”转换为1和0

数据集:

要读取csv数据:

import pandas as pd

df = pd.read_csv("student/student-mat.csv", sep=';')  # read csv
dfmain  = df[df.columns[:-3]]  # no grade columns
dfgrade = df[df.columns[-3:]]  # grade columns

for c in df.columns[16:24]:  # yes\no columns
   dfmain[c] = dfmain[c].apply(lambda x: 0 if str(x)=='no' else 1).astype(int) # no=0, yes=1

print(dfmain[df.columns[16:24]])  # yes\no columns
  • 使用读取\u csv将数据加载到数据帧中。指定分号作为分隔符
  • 使用columns集合调整要从主数据帧中提取的列
  • 使用apply将列从yes\no转换为1\0
以下是csv文件的前5行,以供参考:

school;sex;age;address;famsize;Pstatus;Medu;Fedu;Mjob;Fjob;reason;guardian;traveltime;studytime;failures;schoolsup;famsup;paid;activities;nursery;higher;internet;romantic;famrel;freetime;goout;Dalc;Walc;health;absences;G1;G2;G3
"GP";"F";18;"U";"GT3";"A";4;4;"at_home";"teacher";"course";"mother";2;2;0;"yes";"no";"no";"no";"yes";"yes";"no";"no";4;3;4;1;1;3;6;"5";"6";6
"GP";"F";17;"U";"GT3";"T";1;1;"at_home";"other";"course";"father";1;2;0;"no";"yes";"no";"no";"no";"yes";"yes";"no";5;3;3;1;1;3;4;"5";"5";6
"GP";"F";15;"U";"LE3";"T";1;1;"at_home";"other";"other";"mother";1;2;3;"yes";"no";"yes";"no";"yes";"yes";"yes";"no";4;3;2;2;3;3;10;"7";"8";10
"GP";"F";15;"U";"GT3";"T";4;2;"health";"services";"home";"mother";1;3;0;"no";"yes";"yes";"yes";"yes";"yes";"yes";"yes";3;2;2;1;1;5;2;"15";"14";15
以下是解析csv数据的代码:

import pandas as pd

df = pd.read_csv("student/student-mat.csv", sep=';')  # read csv
dfmain  = df[df.columns[:-3]]  # no grade columns
dfgrade = df[df.columns[-3:]]  # grade columns

for c in df.columns[16:24]:  # yes\no columns
   dfmain[c] = dfmain[c].apply(lambda x: 0 if str(x)=='no' else 1).astype(int) # no=0, yes=1

print(dfmain[df.columns[16:24]])  # yes\no columns
输出(是\否列)


我为帮助而工作。在很多方面都帮助了我,听上去很好。请将答案标记为已接受,以从“无答案”列表中删除帖子。谢谢