Neural network 哪种预测建模技术最有帮助?

Neural network 哪种预测建模技术最有帮助?,neural-network,regression,linear-regression,data-analysis,random-forest,Neural Network,Regression,Linear Regression,Data Analysis,Random Forest,我有一个训练数据集,根据过去几年(2005-2007年)的表现,为我提供了各种板球运动员(2008年)的排名 我必须使用这些数据开发一个模型,然后将其应用于另一个数据集,以使用已经提供给我的数据(2009-2011)预测玩家排名(2012年) 哪种预测模型最适合这种情况?使用不同形式的回归或神经网络的优缺点是什么?使用的模型类型取决于不同的因素: 数据量:如果数据很少,最好选择简单的预测模型,如线性回归。如果您使用的预测模型过于强大,您将面临过度拟合模型的风险,其结果是它会对新数据产生不良影响

我有一个训练数据集,根据过去几年(2005-2007年)的表现,为我提供了各种板球运动员(2008年)的排名

我必须使用这些数据开发一个模型,然后将其应用于另一个数据集,以使用已经提供给我的数据(2009-2011)预测玩家排名(2012年)


哪种预测模型最适合这种情况?使用不同形式的回归或神经网络的优缺点是什么?

使用的模型类型取决于不同的因素:

  • 数据量:如果数据很少,最好选择简单的预测模型,如线性回归。如果您使用的预测模型过于强大,您将面临过度拟合模型的风险,其结果是它会对新数据产生不良影响。现在你可能会问,什么是小数据?这取决于输入维度的数量和数据的基本分布
  • 您对模型的体验。如果你对神经网络没有什么经验,那么它的处理可能会相当棘手。有很多参数需要优化,比如网络层结构、迭代次数、学习速率、动量项等等。相对于这种“元优化”,线性预测更容易处理
如果您仍然无法选择其中一种方法,那么对您来说,一种实用的方法是评估两种不同的预测方法。您在已有目标值的情况下获取一些数据(2008年数据),将其分为培训数据和测试数据(例如,将约10%作为测试数据),使用交叉验证进行培训和测试,并通过将预测值与已有目标值相比较来计算错误率


C.Bishop的《模式识别和机器学习》一书也在网上。它有一个很好的预测模型介绍部分。

使用的模型类型取决于不同的因素:

  • 数据量:如果数据很少,最好选择简单的预测模型,如线性回归。如果您使用的预测模型过于强大,您将面临过度拟合模型的风险,其结果是它会对新数据产生不良影响。现在你可能会问,什么是小数据?这取决于输入维度的数量和数据的基本分布
  • 您对模型的体验。如果你对神经网络没有什么经验,那么它的处理可能会相当棘手。有很多参数需要优化,比如网络层结构、迭代次数、学习速率、动量项等等。相对于这种“元优化”,线性预测更容易处理
如果您仍然无法选择其中一种方法,那么对您来说,一种实用的方法是评估两种不同的预测方法。您在已有目标值的情况下获取一些数据(2008年数据),将其分为培训数据和测试数据(例如,将约10%作为测试数据),使用交叉验证进行培训和测试,并通过将预测值与已有目标值相比较来计算错误率

C.Bishop的《模式识别和机器学习》一书也在网上。它有一个关于预测模型的介绍性章节

  • 哪种预测模型最适合这种情况?2.优点是什么 以及使用不同形式的回归或神经网络的缺点 网络
  • “什么是最好的”取决于你拥有的资源。完全贝叶斯网络(或k-依赖贝叶斯网络)具有从理论上学习到的信息图,是最终的“无假设”模型,通常表现非常好。复杂的神经网络也可以表现出色。这类模型的问题是,它们的计算成本非常高,因此采用近似方法的模型可能更合适。回归、神经网络和贝叶斯网络在数学上有相似之处

  • 回归实际上是一种简单的神经网络形式,对数据有一些额外的假设。神经网络的构建可以减少对数据的假设,但正如Thomas789所指出的,其代价是更难理解(有时难以调试)

  • 作为经验法则-模型中的假设和近似越多,就越容易理解a:理解和B:找到必要的计算能力,但可能以性能或“过度拟合”为代价(此时模型很适合训练数据,但不能外推到一般情况)

    免费网上书籍:

  • 哪种预测模型最适合这种情况?2.优点是什么 以及使用不同形式的回归或神经网络的缺点 网络
  • “什么是最好的”取决于你拥有的资源。完全贝叶斯网络(或k-依赖贝叶斯网络)具有从理论上学习到的信息图,是最终的“无假设”模型,通常表现非常好。复杂的神经网络也可以表现出色。这类模型的问题是,它们的计算成本非常高,因此采用近似方法的模型可能更合适。回归、神经网络和贝叶斯网络在数学上有相似之处

  • 回归实际上是一种简单的神经网络形式,对数据有一些额外的假设。神经网络的构建可以减少对数据的假设,但正如Thomas789所指出的,其代价是更难理解(有时难以调试)

  • 作为惯例