Python 3.x 基于独立因素预测电影的收视率
我不熟悉机器学习,拥有imdb电影数据集,并试图根据以下因素预测电影的“imdbRating”:“Python 3.x 基于独立因素预测电影的收视率,python-3.x,machine-learning,Python 3.x,Machine Learning,我不熟悉机器学习,拥有imdb电影数据集,并试图根据以下因素预测电影的“imdbRating”:“”评级计数“,”nrOfWins“,”nrOfNominations“,”nrOfPhotos“,”nrOfNewsArticles“,”nrOfUserReviews“,”nrOfGenre“ 我最简单的python代码是 我在代码中使用了“支持向量回归”机器学习算法。我只想知道python代码中显示的方法是否正确有效,如果这种方法正确,那么我是否可以使用其他回归算法,如RandomForestR
”评级计数“
,”nrOfWins“
,”nrOfNominations“
,”nrOfPhotos“
,”nrOfNewsArticles“
,”nrOfUserReviews“
,”nrOfGenre“
我最简单的python代码是
我在代码中使用了“支持向量回归”机器学习算法。我只想知道python代码中显示的方法是否正确有效,如果这种方法正确,那么我是否可以使用其他回归算法,如RandomForestRegression
,DecisionTreeRegression
,以同样简单的代码方式预测'imdbRatings'
如果我的方法是错误的,那么是因为我有多个自变量,我应该只使用一个自变量来预测“imdbRating”,这是我的因变量
X = df[['ratingCount', 'nrOfWins', 'nrOfNominations','nrOfPhotos','nrOfNewsArticles', 'nrOfUserReviews', 'nrOfGenre']][0:100].values
y = df['imdbRating'][0:100].values
from sklearn.svm import SVR
regressor = SVR()
regressor.fit(X, y)
regressor.predict([[40550, 1, 0, 19, 96.0, 85.0, 3.0]])
输出:
数组([8.3859375])
查看您的代码和数据集,您需要IMDb提供更多的数据才能完成此工作。支持向量回归算法无法根据6个示例进行解释和预测。您可能需要数百个具有不同评级、非常不同的示例。祝你的项目好运 我在上面的代码中所展示的是,只获取100个数据集值,但我在实际数据集中有15000行/单元。15000行数据是实现这一点的一个很好的数量。祝你好运感谢您的回复,所以我想我的基本方法在代码中是正确的。是的,您的方法是正确的,这一切都取决于拥有正确的数据量和正确的类型。祝你的项目玩得开心谢谢你的回复Noah Meislik。你的建议对像我这样刚开始学习机器学习算法的新手来说很有价值。