Python 3.x 基于独立因素预测电影的收视率_Python 3.x_Machine Learning

Python 3.x 基于独立因素预测电影的收视率

python-3.x machine-learning

Python 3.x 基于独立因素预测电影的收视率,python-3.x,machine-learning,Python 3.x,Machine Learning,我不熟悉机器学习，拥有imdb电影数据集，并试图根据以下因素预测电影的“imdbRating”：“”评级计数“，”nrOfWins“，”nrOfNominations“，”nrOfPhotos“，”nrOfNewsArticles“，”nrOfUserReviews“，”nrOfGenre“ 我最简单的python代码是我在代码中使用了“支持向量回归”机器学习算法。我只想知道python代码中显示的方法是否正确有效，如果这种方法正确，那么我是否可以使用其他回归算法，如RandomForestR

我不熟悉机器学习，拥有imdb电影数据集，并试图根据以下因素预测电影的“imdbRating”：“

”评级计数“

，

”nrOfWins“

，

”nrOfNominations“

，

”nrOfPhotos“

，

”nrOfNewsArticles“

，

”nrOfUserReviews“

，

”nrOfGenre“

我最简单的python代码是

我在代码中使用了“支持向量回归”机器学习算法。我只想知道python代码中显示的方法是否正确有效，如果这种方法正确，那么我是否可以使用其他回归算法，如

RandomForestRegression

，

DecisionTreeRegression

，以同样简单的代码方式预测

'imdbRatings'

如果我的方法是错误的，那么是因为我有多个自变量，我应该只使用一个自变量来预测“imdbRating”，这是我的因变量

X = df[['ratingCount', 'nrOfWins', 'nrOfNominations','nrOfPhotos','nrOfNewsArticles', 'nrOfUserReviews', 'nrOfGenre']][0:100].values
y = df['imdbRating'][0:100].values

from sklearn.svm import SVR

regressor  =  SVR()

regressor.fit(X, y)
regressor.predict([[40550, 1, 0, 19, 96.0, 85.0, 3.0]])

输出：

数组（[8.3859375]）

查看您的代码和数据集，您需要IMDb提供更多的数据才能完成此工作。支持向量回归算法无法根据6个示例进行解释和预测。您可能需要数百个具有不同评级、非常不同的示例。祝你的项目好运

我在上面的代码中所展示的是，只获取100个数据集值，但我在实际数据集中有15000行/单元。15000行数据是实现这一点的一个很好的数量。祝你好运感谢您的回复，所以我想我的基本方法在代码中是正确的。是的，您的方法是正确的，这一切都取决于拥有正确的数据量和正确的类型。祝你的项目玩得开心谢谢你的回复Noah Meislik。你的建议对像我这样刚开始学习机器学习算法的新手来说很有价值。