Machine learning 使用scikit学习预测网站上的好内容
我从一个网站上得到了一年的数据。我想训练一种机器学习算法,根据某些变量(例如字数、发布时间等)预测新内容的成功率 我想获取一个新的数据,输入它的某些特征,并获得它在站点上运行的概率 此外,我希望继续向训练集中添加未来的数据,并不断训练算法,使其随着时间的推移变得更智能Machine learning 使用scikit学习预测网站上的好内容,machine-learning,scikit-learn,prediction,Machine Learning,Scikit Learn,Prediction,我从一个网站上得到了一年的数据。我想训练一种机器学习算法,根据某些变量(例如字数、发布时间等)预测新内容的成功率 我想获取一个新的数据,输入它的某些特征,并获得它在站点上运行的概率 此外,我希望继续向训练集中添加未来的数据,并不断训练算法,使其随着时间的推移变得更智能 我的问题是:我应该如何使用scikit学习来完成这项工作?您遇到的是一个二进制分类问题,即您必须确定给定的输入是否正确 尝试不同的回归算法,scikits learn可以让切换算法变得非常容易,让您可以看到哪些算法有效,哪些算法无
我的问题是:我应该如何使用scikit学习来完成这项工作?您遇到的是一个二进制分类问题,即您必须确定给定的输入是否正确 尝试不同的回归算法,scikits learn可以让切换算法变得非常容易,让您可以看到哪些算法有效,哪些算法无效 在我的脑海中,我会尝试以下几种方法:
- 支持向量机
- 随机森林(scikits中随机树的森林)
- 回归(脊线、套索、IRLS、逻辑)
- 朴素贝叶斯
- k近邻
如果您构建scikit,则不必阅读0.10版本的文档,而应该阅读最新的稳定文档,或者从github上托管的主分支学习开发版本的文档: