Python 无最后一个值的CSV文件到数组_Python_Neural Network_Dataset

Python 无最后一个值的CSV文件到数组

python neural-network

Python 无最后一个值的CSV文件到数组,python,neural-network,dataset,Python,Neural Network,Dataset,因此，我对Python和神经网络领域相当陌生。我编写了一些神经网络（主要是CNN），但这些只是一些测试项目。在教程等的帮助下，我完成了它们。现在我正试图编写一个简单的神经网络，通过一些“指标”预测学生的成绩。问题是“变量”不是用列分隔的。我需要将指标分为一个包含所有指标的列表，没有最后一个指标，还有一个包含最后一个指标但没有其他内容的列表。我还非常确定我需要将“是”和“否”转换为1和0 数据集：要读取csv数据： import pandas as pd df = pd.read_csv(&qu

因此，我对Python和神经网络领域相当陌生。我编写了一些神经网络（主要是CNN），但这些只是一些测试项目。在教程等的帮助下，我完成了它们。现在我正试图编写一个简单的神经网络，通过一些“指标”预测学生的成绩。问题是“变量”不是用列分隔的。我需要将指标分为一个包含所有指标的列表，没有最后一个指标，还有一个包含最后一个指标但没有其他内容的列表。我还非常确定我需要将“是”和“否”转换为1和0

数据集：

要读取csv数据：

import pandas as pd

df = pd.read_csv("student/student-mat.csv", sep=';')  # read csv
dfmain  = df[df.columns[:-3]]  # no grade columns
dfgrade = df[df.columns[-3:]]  # grade columns

for c in df.columns[16:24]:  # yes\no columns
   dfmain[c] = dfmain[c].apply(lambda x: 0 if str(x)=='no' else 1).astype(int) # no=0, yes=1

print(dfmain[df.columns[16:24]])  # yes\no columns

使用读取\u csv将数据加载到数据帧中。指定分号作为分隔符
使用columns集合调整要从主数据帧中提取的列
使用apply将列从yes\no转换为1\0

以下是csv文件的前5行，以供参考：

school;sex;age;address;famsize;Pstatus;Medu;Fedu;Mjob;Fjob;reason;guardian;traveltime;studytime;failures;schoolsup;famsup;paid;activities;nursery;higher;internet;romantic;famrel;freetime;goout;Dalc;Walc;health;absences;G1;G2;G3
"GP";"F";18;"U";"GT3";"A";4;4;"at_home";"teacher";"course";"mother";2;2;0;"yes";"no";"no";"no";"yes";"yes";"no";"no";4;3;4;1;1;3;6;"5";"6";6
"GP";"F";17;"U";"GT3";"T";1;1;"at_home";"other";"course";"father";1;2;0;"no";"yes";"no";"no";"no";"yes";"yes";"no";5;3;3;1;1;3;4;"5";"5";6
"GP";"F";15;"U";"LE3";"T";1;1;"at_home";"other";"other";"mother";1;2;3;"yes";"no";"yes";"no";"yes";"yes";"yes";"no";4;3;2;2;3;3;10;"7";"8";10
"GP";"F";15;"U";"GT3";"T";4;2;"health";"services";"home";"mother";1;3;0;"no";"yes";"yes";"yes";"yes";"yes";"yes";"yes";3;2;2;1;1;5;2;"15";"14";15

以下是解析csv数据的代码：

import pandas as pd

df = pd.read_csv("student/student-mat.csv", sep=';')  # read csv
dfmain  = df[df.columns[:-3]]  # no grade columns
dfgrade = df[df.columns[-3:]]  # grade columns

for c in df.columns[16:24]:  # yes\no columns
   dfmain[c] = dfmain[c].apply(lambda x: 0 if str(x)=='no' else 1).astype(int) # no=0, yes=1

print(dfmain[df.columns[16:24]])  # yes\no columns

输出（是\否列）

我为帮助而工作。在很多方面都帮助了我，听上去很好。请将答案标记为已接受，以从“无答案”列表中删除帖子。谢谢