Machine learning 仅根据同一场比赛的以往数据预测足球比赛胜负

Machine learning 仅根据同一场比赛的以往数据预测足球比赛胜负,machine-learning,neural-network,regression,prediction,Machine Learning,Neural Network,Regression,Prediction,我是一个超级足球迷,对机器学习也很感兴趣。作为我的ML课程的一个项目,我正在尝试建立一个模型,根据主客场球队的名称预测主队获胜的机会。(我查询我的数据集,并根据这两支球队之前的比赛创建数据点) 我有所有球队的几个赛季的数据,但是我有以下问题,我希望得到一些建议。。EPL(英格兰超级联赛)有20支球队,在主客场比赛中相互对决(一个赛季总共380场比赛)。因此,每个赛季,任何两支球队只会相互比赛两次 我有过去10多年的数据,这两个团队的数据点为2*10=20。然而,我不想超过3年,因为我相信球队会随

我是一个超级足球迷,对机器学习也很感兴趣。作为我的ML课程的一个项目,我正在尝试建立一个模型,根据主客场球队的名称预测主队获胜的机会。(我查询我的数据集,并根据这两支球队之前的比赛创建数据点)

我有所有球队的几个赛季的数据,但是我有以下问题,我希望得到一些建议。。EPL(英格兰超级联赛)有20支球队,在主客场比赛中相互对决(一个赛季总共380场比赛)。因此,每个赛季,任何两支球队只会相互比赛两次

我有过去10多年的数据,这两个团队的数据点为2*10=20。然而,我不想超过3年,因为我相信球队会随着时间的推移发生很大的变化(曼城,利物浦),这只会给系统带来更多的错误

因此,每对团队的结果大约是6-8个数据点。然而,对于每一个数据点,我都有一些功能(最多20+),比如全场进球、半场进球、传球、投篮、黄牌、红牌等。对于这两支球队,我可以包括一些功能,比如最近的状态、最近的主场状态、最近的客场状态等

然而,对于我来说,仅有6-8个数据点进行训练的想法似乎是不正确的。我有什么想法可以解决这个问题吗?(如果这首先是个问题,即)

谢谢


编辑:FWIW,这里有一个链接到我的报告,我是在我的项目完成时编辑的。这不是什么“伟大”的东西,但我认为我设法得出的一些观察结果非常酷(比如我的预测对德甲非常有效,因为拜仁一直赢得联赛)。

这是一个有趣的问题,我认为没有唯一的解决方案。然而,如果我处在你的位置,我可以尝试一些小事情

我和你一样,担心每堂课6-8分的数据太少,无法建立一个可靠的模型。因此,我会尝试以不同的方式对问题进行建模。为了让每个班都有更多的数据,我没有20个班,而是只有两个班(主客场),我会添加两个功能,一个用于主队,另一个用于客队。在这种情况下,你仍然可以预测哪支球队在主客场比赛中获胜,而你的问题有更多的数据来产生结果


另一个想法是从其他欧洲联赛获取数据。由于现在球队是一个功能,而不是一个类别,它不应该给你的模型增加太多噪音,你可以从额外的数据中受益(假设这些功能在其他联赛中有效)

不知道这是否仍然有用,但是像全场进球、半场进球、传球、投篮、黄牌、红牌等功能,等是您想要分类的新匹配项所没有的功能

我会将此视为一个分类问题(您希望将匹配分为3个类别之一:1、X或2),并添加更多也可以应用于新匹配的功能。i、 e:失踪球员的数量(由于受伤/红牌),每支球队在比赛前的连续胜利/平局/失利数量,即主队(已经提到),最近几场主客场比赛的进球数等等


6-8场比赛才是真正的问题。这个数据集非常小,会有很多过度拟合的情况,但是如果你使用像我提到的那些功能,我认为你也可以使用较旧的数据。

我有一些类似的系统-football-data.co.uk是源数据的良好基础。 我用过去的N个赛季为每个联赛建立了一个模型(相信我,3年以上是必须的!)。取决于您的标准函数-如果标准是最佳拟合或最大利润,您可以建立自己的预测模型

要知道的一件非常好的事情是,每个联赛都是不同的,而且收受赌注者在比利时对favorite的主场获胜几率与在英国第五联赛不同,例如,在那里你们可以找到真正有价值的几率

从中,您可以编译有趣的模型,例如在特定的比赛中击败收受赌注者,使用您的模式并进行价值赌注。或者,你可以尽可能多地追求赢球秘诀,但可能赚得少一些(抽奖可以赚很多钱,尽管抽奖的次数少了)


希望我能给你一些想法,想了解更多,请随意提问。

嘿,谢谢你的意见。。是的,我想用这种方法来建模我的数据。。这将使我每个季度拥有大约380个数据点,我可以使用数千个数据点。然而,这将解决的问题只是“主队赢得一场比赛的机会”。。它将返回相同的值,比如说,一支三级联赛球队与一支冠军联赛球队比赛,或者任何一支球队与任何其他球队比赛。@keithxm23嘿,很高兴听到你的回音。。。“主队赢得比赛的机会”,不一定。考虑到你的特征包括主队和客队(如果你将每个分区作为附加特征包括得更好),那么输出将为“主队是a,客队是B,主队赢得比赛的机会”。这有意义吗?哦!那么你的意思是,对于主队来说,根据其最近的主场状态预测获胜的机会,然后对于客队来说,根据其最近的客场状态预测获胜的机会。。然后比较这两个变量并做出预测。那是个好主意。。所以在这之后我在想,如何也包括知识,特别是关于两队(A队和B队)之前的比赛,因为我相信这也会有巨大的价值。。所以我想到的一个想法是,在计算了两支球队在某个时间点的“主场状态”和“客场状态”之后,还要计算每支球队的表现……每支球队在比赛中的表现如何(即a-vs-B&B-vs-a)