Machine learning 使用我的汽车数据集进行机器学习

Machine learning 使用我的汽车数据集进行机器学习,machine-learning,classification,machine-learning-model,Machine Learning,Classification,Machine Learning Model,我对机器学习很陌生。 我有一个数据集,包含f1比赛给我的数据。用户正在玩这个游戏,并给我这个数据集。 使用机器学习,我必须处理这些数据,当用户(我知道他们10岁)玩游戏时,我必须识别谁在玩 数据由发生频率为1/10秒的数据报数据包组成,数据包包含以下时间、圈数、圈距、总距离、速度、轿厢位置、牵引力控制、最后一圈时间、燃油、档位等 我曾想过使用一个kmeans,以一种有监督的方式使用。 哪种算法可能更好?这是一个比较宽泛的问题,所以我会尽我最大的努力 kmeans是一种无监督的算法,这意味着它会找

我对机器学习很陌生。 我有一个数据集,包含f1比赛给我的数据。用户正在玩这个游戏,并给我这个数据集。 使用机器学习,我必须处理这些数据,当用户(我知道他们10岁)玩游戏时,我必须识别谁在玩


数据由发生频率为1/10秒的数据报数据包组成,数据包包含以下
时间、圈数、圈距、总距离、速度、轿厢位置、牵引力控制、最后一圈时间、燃油、档位等

我曾想过使用一个kmeans,以一种有监督的方式使用。
哪种算法可能更好?

这是一个比较宽泛的问题,所以我会尽我最大的努力

kmeans是一种无监督的算法,这意味着它会找到类本身,当你知道有多个类,但你不知道它们到底是什么时,最好使用它。。。将它与带标签的数据一起使用只意味着您将计算新向量v到数据集中每个向量的距离,并选择一个(或使用多数投票的向量)给出最小距离,这不被视为机器学习

在这种情况下,当您有标签时,受监督的方法将产生更好的结果

我建议尝试一下,首先,这些是最基本和最常用的算法,它们给出了非常好的结果

如果你还没有达到预期的精度,你可以使用深度学习,建立一个神经网络,输入层与你的数据包的值一样大,输出层与类的数量相同,在这两者之间,你可以使用一个或多个隐藏层与不同的节点,但这是一种先进的方法,在追求它之前,你们最好先在机器学习领域积累一些经验


注:数据是一个时间序列,这意味着每个驾驶员都有自己驾驶汽车的行为,因此数据应该被视为大量的点,有了这些点,你可以应用模式匹配技术,也有一些神经网络正是为这些数据构建的(如)但这是一项非常先进的任务,而且要实现起来要困难得多。

这项任务必须是多类分类。任何机器学习活动的第一步都是定义分数度量()。这允许您比较模型之间的差异,并决定哪一个更好。然后按照另一个答案中的建议,用随机森林或/和逻辑回归建立一个基础模型——它们在开箱即用的情况下表现良好。然后尝试使用功能,了解其中哪些信息更丰富。不要忘了可视化——它们为数据争论等提供了很多提示。

没有任何明确的答案,你必须尝试多种分类算法,看看什么最有效,也许你可以稍微描述一下你的数据。。。它可能有助于指导您正确的方向每1/10秒用户都会给我一个数据包,其中包含:时间、圈数、圈距、总距离、速度、车辆位置、牵引力控制、最后一圈时间、燃油、档位、,..@gio无需在评论中重复您在帖子中已经包含的内容…@desertnaut我编辑他的帖子以反映评论,这增加了新数据。。。你可以像其他人一样贬低我的答案,至少你会有一个理由非常感谢你。。你觉得svm怎么样?是的,你也应该试试,它有一个问题,需要数据是线性可分离的,否则需要使用核函数将数据转换到更高的维度,但这也是一个好的开始