Machine learning 如何判断您是否可以将机器学习应用于项目?

Machine learning 如何判断您是否可以将机器学习应用于项目?,machine-learning,data-science,Machine Learning,Data Science,我正在做一个个人项目,我将我所在城市的自行车租赁服务的数据记录在MySQL数据库中。脚本每30分钟运行一次,记录每个自行车站的数据和每个站的免费自行车。然后,在我的数据库中,我平均每个站点在给定时间内每天的可用性,使之与今天一样,是一个大约2个月的数据记录预测 我读过一些关于机器学习的书,我想学一点。是否有可能用我的数据训练一个模型,并在将来用ML做出更好的预测?答案很可能是肯定的 第一步是要有一些数据,听起来像是这样。你有一个响应免费自行车和一些功能,它可以改变时间,地点。您已经应用了一个基本

我正在做一个个人项目,我将我所在城市的自行车租赁服务的数据记录在MySQL数据库中。脚本每30分钟运行一次,记录每个自行车站的数据和每个站的免费自行车。然后,在我的数据库中,我平均每个站点在给定时间内每天的可用性,使之与今天一样,是一个大约2个月的数据记录预测


我读过一些关于机器学习的书,我想学一点。是否有可能用我的数据训练一个模型,并在将来用ML做出更好的预测?

答案很可能是肯定的

第一步是要有一些数据,听起来像是这样。你有一个响应免费自行车和一些功能,它可以改变时间,地点。您已经应用了一个基本的条件平均值模型,方法是对因子的值进行平均。 您可以使用一些日历事件(如假日或本地事件标志)来扩充您所知道的有关位置的数据

准备一个每个观测值一行的数据集,并在一段时间内用平均绝对百分比误差MAPE等度量标准对当前预测过程的准确性进行基准测试。确保您对验证期的预测平均值不包括验证期内的任何数据! 使用此期间的数据验证您尝试的其他模型

将剩余数据的一部分分割成一个测试集,并使用其余数据进行训练。如果您有大量数据,那么常见的培训/测试划分为70/30。如果数据很小,则可能下降到90/10

在训练集中学习一个或多个机器学习模型,定期在测试集中检查性能,以确保泛化性能仍在提高。许多训练算法实现将为您管理这一点,并在测试性能因过度拟合而开始下降时自动停止。这是机器学习相对于你目前的平均水平的一大优势,即学习概括的东西和抛弃不概括的东西的能力

通过预测验证集、计算MAPE并将模型的MAPE与同一时期的原始流程的MAPE进行比较,验证每个模型。祝你好运,享受了解机器学习的乐趣