Python 加速度计数据的分类_Python_Machine Learning

Python 加速度计数据的分类

python machine-learning

Python 加速度计数据的分类,python,machine-learning,Python,Machine Learning,我试图将加速度计数据分为4类-1、2、3、4。培训数据集如下所示- 培训标签包含在另一个文件中，仅包含第10次观察的标签。这就是它看起来的样子- 现在我不知道该如何解释这一点。我应该只使用training_labels数据集来训练模型吗？在这种情况下，我不知道为什么会给出第一个数据集。此外，仅使用第二组会导致信息丢失。我曾想过对第一个数据集与第二个数据集进行左外连接，并在df.fillna（）中使用“bfill”来去除Nan值，然后使用该数据进行训练，但我不清楚这是否是正确的方法。我还是一个

我试图将加速度计数据分为4类-1、2、3、4。培训数据集如下所示-

培训标签包含在另一个文件中，仅包含第10次观察的标签。这就是它看起来的样子-

现在我不知道该如何解释这一点。我应该只使用training_labels数据集来训练模型吗？在这种情况下，我不知道为什么会给出第一个数据集。此外，仅使用第二组会导致信息丢失。我曾想过对第一个数据集与第二个数据集进行左外连接，并在df.fillna（）中使用“bfill”来去除Nan值，然后使用该数据进行训练，但我不清楚这是否是正确的方法。我还是一个机器学习的初学者，所以非常感谢您的帮助

编辑：数据来自我正在学习的在线课程。上面说——“由于加速计的采样频率很高，因此每10次观测仅提供一次列_标签中的标签

如果您有能力丢弃90%的数据，您可以仅使用带标签的观测值，还可以取平均值/中值x，y，用提供的标签表示10次观测的z坐标，或对最后10次观测使用相同的标签。这些方法对我来说似乎是合法的

可能采样频率不必要太高，因此您可以假设标签不会很快更改。但这也取决于手头的问题。

您的数据来自哪里？也许有一个解释，为什么每10次观察才有一个标签。或者，您可以假设标签在10次观察中保持不变，即最多每10个时间步更改一次。可能采样频率太高了。是的，数据描述中说加速度计是以高频采样的。我添加了一个“编辑”来突出显示这一点