Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/jsp/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 3.x 基于独立因素预测电影的收视率_Python 3.x_Machine Learning - Fatal编程技术网

Python 3.x 基于独立因素预测电影的收视率

Python 3.x 基于独立因素预测电影的收视率,python-3.x,machine-learning,Python 3.x,Machine Learning,我不熟悉机器学习,拥有imdb电影数据集,并试图根据以下因素预测电影的“imdbRating”:“”评级计数“,”nrOfWins“,”nrOfNominations“,”nrOfPhotos“,”nrOfNewsArticles“,”nrOfUserReviews“,”nrOfGenre“ 我最简单的python代码是 我在代码中使用了“支持向量回归”机器学习算法。我只想知道python代码中显示的方法是否正确有效,如果这种方法正确,那么我是否可以使用其他回归算法,如RandomForestR

我不熟悉机器学习,拥有imdb电影数据集,并试图根据以下因素预测电影的“imdbRating”:“
”评级计数“
”nrOfWins“
”nrOfNominations“
”nrOfPhotos“
”nrOfNewsArticles“
”nrOfUserReviews“
”nrOfGenre“

我最简单的python代码是

我在代码中使用了“支持向量回归”机器学习算法。我只想知道python代码中显示的方法是否正确有效,如果这种方法正确,那么我是否可以使用其他回归算法,如
RandomForestRegression
DecisionTreeRegression
,以同样简单的代码方式预测
'imdbRatings'

如果我的方法是错误的,那么是因为我有多个自变量,我应该只使用一个自变量来预测“imdbRating”,这是我的因变量

X = df[['ratingCount', 'nrOfWins', 'nrOfNominations','nrOfPhotos','nrOfNewsArticles', 'nrOfUserReviews', 'nrOfGenre']][0:100].values
y = df['imdbRating'][0:100].values

from sklearn.svm import SVR

regressor  =  SVR()

regressor.fit(X, y)
regressor.predict([[40550, 1, 0, 19, 96.0, 85.0, 3.0]])

输出:
数组([8.3859375])

查看您的代码和数据集,您需要IMDb提供更多的数据才能完成此工作。支持向量回归算法无法根据6个示例进行解释和预测。您可能需要数百个具有不同评级、非常不同的示例。祝你的项目好运

我在上面的代码中所展示的是,只获取100个数据集值,但我在实际数据集中有15000行/单元。15000行数据是实现这一点的一个很好的数量。祝你好运感谢您的回复,所以我想我的基本方法在代码中是正确的。是的,您的方法是正确的,这一切都取决于拥有正确的数据量和正确的类型。祝你的项目玩得开心谢谢你的回复Noah Meislik。你的建议对像我这样刚开始学习机器学习算法的新手来说很有价值。