Machine learning 如何从数组中预测类?

Machine learning 如何从数组中预测类?,machine-learning,data-science,prediction,shapes,supervised-learning,Machine Learning,Data Science,Prediction,Shapes,Supervised Learning,我有以下数据科学问题:我有一组数组。一个数组表示照明、供暖或通风的月消耗量,其中每行表示一小时的消耗量。因此,对于一年中的每个月,我有3个数组 例如,一个表示2019年3月加热消耗量的数组如下所示: 目的是预测一个月的消耗类型(照明、供暖或通风)。 所以,如果我想用决策树或神经网络为例。如何塑造数据变量是什么?通常,一行是数据,列是变量,但在我的例子中,一组行代表“一个数据”,我不知道变量是什么 我试着计算最大值,最小值,标准值,平均值等等…总结一个数组就是一行。但是,我想知道是否有另一种方法

我有以下数据科学问题:我有一组数组。一个数组表示照明、供暖或通风的月消耗量,其中每行表示一小时的消耗量。因此,对于一年中的每个月,我有3个数组

例如,一个表示2019年3月加热消耗量的数组如下所示:

目的是预测一个月的消耗类型(照明、供暖或通风)。 所以,如果我想用决策树或神经网络为例。如何塑造数据变量是什么?通常,一行是数据,列是变量,但在我的例子中,一组行代表“一个数据”,我不知道变量是什么

我试着计算最大值,最小值,标准值,平均值等等…总结一个数组就是一行。但是,我想知道是否有另一种方法可以对数组集进行这种预测


多谢各位

您的数据格式没有问题

变量是什么? 你说你想对一个整月的数组进行分类?那么你的变量就是整个月的数组。而不是单个行(或您引用的行)。因此,在您的模型中,一个数据将是一个月,因为这是您希望模型学习和预测(或分类)的内容

此外,如果您使用的是神经网络架构,那么在训练阶段,您显然需要标签。您不应该为每行或每小时提供一个标签,而应该为每个月提供一个标签

你可以取一个月的平均值或中位数或哪个统计数据来构造特征,但这是神经网络的工作

我不知道你的数据集有多大,但是如果你每节课没有几个月的时间,你会遇到一些问题

我希望这能让你走上正确的方向,把事情弄清楚


编辑:输入错误

你能解释一下“消费类型”是什么意思吗?样品是否都属于同一客户?你期望得到什么样的结果?我不知道这门课是从哪里来的?如果我们给模型一个月的消耗量,比如上面的例子(没有最后一列),这个模型必须识别它是照明、供暖还是通风消耗。这些样本来自同一栋建筑。这些数据是从大楼的米数处获取的。谢谢