读取CSV文本文件,以便在Python中学习决策树

读取CSV文本文件,以便在Python中学习决策树,python,algorithm,csv,classification,decision-tree,Python,Algorithm,Csv,Classification,Decision Tree,使用导入csv和导入系统 我如何阅读逗号分隔的值和属性列表,以便确定所述属性的信息增益,从而生成决策树模型?这是一个csv和一个包含属性及其潜在值的文本文件 罗素和诺维格的一个例子: restaurant.csv: Will-Wait,Alternative,Bar,Fri/Sat,Hungry,Patrons,Price,Rain,Reservation,Type,Estimated-Wait Yes,Yes,No,No,Yes,Some,$$$,No,Yes,French,0-10 No,Y

使用导入csv和导入系统

我如何阅读逗号分隔的值和属性列表,以便确定所述属性的信息增益,从而生成决策树模型?这是一个csv和一个包含属性及其潜在值的文本文件

罗素和诺维格的一个例子:

restaurant.csv:

Will-Wait,Alternative,Bar,Fri/Sat,Hungry,Patrons,Price,Rain,Reservation,Type,Estimated-Wait
Yes,Yes,No,No,Yes,Some,$$$,No,Yes,French,0-10
No,Yes,No,No,Yes,Full,$,No,No,Thai,30-60
Yes,No,Yes,No,No,Some,$,No,No,Burger,0-10
Yes,Yes,No,Yes,Yes,Full,$,No,No,Thai,10-30
No,Yes,No,Yes,No,Full,$$$,No,Yes,French,>60
Yes,No,Yes,No,Yes,Some,$$,Yes,Yes,Italian,0-10
No,No,Yes,No,No,None,$,Yes,No,Burger,0-10
Yes,No,No,No,Yes,Some,$$,Yes,Yes,Thai,0-10
No,No,Yes,Yes,No,Full,$,Yes,No,Burger,>60
No,Yes,Yes,Yes,Yes,Full,$$$,No,Yes,Italian,10-30
No,No,No,No,No,None,$,No,No,Thai,0-10
Yes,Yes,Yes,Yes,Yes,Full,$,No,No,Burger,30-60
restaurant-attributes.txt:

Will-Wait,Yes,No
Alternative,Yes,No
Bar,No,Yes
Fri/Sat,No,Yes
Hungry,Yes,No
Patrons,Some,Full,None
Price,$$$,$,$$
Rain,No,Yes
Reservation,Yes,No
Type,French,Thai,Burger,Italian
Estimated-Wait,0-10,30-60,10-30,>60
用这样的东西

restaurantSet = []

with open(sys.argv[1], newline='') as csvfile:
    restaurant = csv.reader(csvfile, delimiter=' ', quotechar='|')
    for val in restaurant:
        x = [q for q in val]
        restaurantSet.append(x)

列出每个属性和属性值的最佳方法是什么;i、 e.赞助人将是一份名单[一些,全部,一些,全部,一些,没有,一些,全部,全部,没有,全部]。

如果你不介意使用熊猫,你可以简单地使用它

data = pd.read_csv("restaurant.csv", sep=",")

如果你不介意使用熊猫,你可以简单地使用它

data = pd.read_csv("restaurant.csv", sep=",")

问题到底是什么?如何从文件中读取数据?来自stdin?这是个好问题。您是否希望根据自己的直觉生成决策树?或者你想用机器学习来建立最优的树?问题到底是什么?如何从文件中读取数据?来自stdin?这是个好问题。您是否希望根据自己的直觉生成决策树?或者你想用机器学习来建立最优的树?是的,我认为这是一个很好的答案的开始。是的,我认为这是一个很好的答案的开始。