Python 如何解释knn和决策树的结果?

Python 如何解释knn和决策树的结果?,python,decision-tree,knn,Python,Decision Tree,Knn,关于我的目标的详细信息: 我使用IMDb数据和Youtube电影预告片数据来预测电影的总票房。 具体来说,我使用“范围”、“总量”、“预算”、“imdb_分数”、“视图”和“评级”进行分类 所以,我通过KNN和决策树1)预测电影的成功,并知道哪种机器学习更准确 但问题是,我的knn结果 feature_columns = ['range', 'gross', 'budget','imdb_score','views','rating'] X = df2[feature_columns].valu

关于我的目标的详细信息: 我使用IMDb数据和Youtube电影预告片数据来预测电影的总票房。 具体来说,我使用“范围”、“总量”、“预算”、“imdb_分数”、“视图”和“评级”进行分类

所以,我通过KNN和决策树1)预测电影的成功,并知道哪种机器学习更准确

但问题是,我的knn结果

feature_columns = ['range', 'gross', 'budget','imdb_score','views','rating']
X = df2[feature_columns].values
y = df2['range'].values

knn = KNeighborsClassifier(n_neighbors=3, metric='euclidean')
knn.fit(X_train, y_train)

confusion_matrix(y_test, y_pred)
最终得出我们模型的准确率为94.0%。 与

对于决策树

feature_cols = ["budget","imdb_score","views","rating"]
y = df2.range
X = df2[feature_cols]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1)

clf = DecisionTreeClassifier(criterion="entropy") #Default criterion is gini index, If you want to use gini index just delete criterion

clf = clf.fit(X_train,y_train) #Training

y_pred = clf.predict(X_test) #Make a prediction

print("Accuracy:",metrics.accuracy_score(y_test, y_pred))
最终的准确度为:0.48333334

dot_data = StringIO()
export_graphviz(clf, out_file=dot_data,  
                filled=True, rounded=True,
                special_characters=True,feature_names = feature_cols,class_names=["0","1","2","3"]) ##Change class i named 0, and 1 since i only have to class
graph = pydotplus.graph_from_dot_data(dot_data.getvalue())  
graph.write_png('house.png') #will saved to your default location. in coolab it is content folder 
Image(graph.create_png())

我的问题是, 1) 我的结果是否反映了我的主题?KNN准确率为94%,决策树准确率为48%,这一事实令人困惑。我认为决策树的准确性会更高。 2) 我特别不确定KNN和决策树的列特征是否相同,以反映相同的结果。是否对我的功能进行了不同的编辑?


谢谢你的阅读

在KNN中,您也在训练数据中给出了目标列范围,因此与决策树相比,模型的准确性非常高

您在决策树的训练数据中遗漏了总体特征。 因此,您不应该比较这两种算法的性能,因为它们具有不同的训练数据。请使用这两种算法的相同训练数据重试

注意:请说明总量和范围的含义

dot_data = StringIO()
export_graphviz(clf, out_file=dot_data,  
                filled=True, rounded=True,
                special_characters=True,feature_names = feature_cols,class_names=["0","1","2","3"]) ##Change class i named 0, and 1 since i only have to class
graph = pydotplus.graph_from_dot_data(dot_data.getvalue())  
graph.write_png('house.png') #will saved to your default location. in coolab it is content folder 
Image(graph.create_png())