Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/286.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/ios/111.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 加速度计数据的分类_Python_Machine Learning - Fatal编程技术网

Python 加速度计数据的分类

Python 加速度计数据的分类,python,machine-learning,Python,Machine Learning,我试图将加速度计数据分为4类-1、2、3、4。培训数据集如下所示- 培训标签包含在另一个文件中,仅包含第10次观察的标签。这就是它看起来的样子- 现在我不知道该如何解释这一点。我应该只使用training_labels数据集来训练模型吗?在这种情况下,我不知道为什么会给出第一个数据集。此外,仅使用第二组会导致信息丢失。我曾想过对第一个数据集与第二个数据集进行左外连接,并在df.fillna()中使用“bfill”来去除Nan值,然后使用该数据进行训练,但我不清楚这是否是正确的方法。我还是一个

我试图将加速度计数据分为4类-1、2、3、4。培训数据集如下所示-

培训标签包含在另一个文件中,仅包含第10次观察的标签。这就是它看起来的样子-

现在我不知道该如何解释这一点。我应该只使用training_labels数据集来训练模型吗?在这种情况下,我不知道为什么会给出第一个数据集。此外,仅使用第二组会导致信息丢失。我曾想过对第一个数据集与第二个数据集进行左外连接,并在df.fillna()中使用“bfill”来去除Nan值,然后使用该数据进行训练,但我不清楚这是否是正确的方法。我还是一个机器学习的初学者,所以非常感谢您的帮助


编辑:数据来自我正在学习的在线课程。上面说——“由于加速计的采样频率很高,因此每10次观测仅提供一次列_标签中的标签

如果您有能力丢弃90%的数据,您可以仅使用带标签的观测值,还可以取平均值/中值x,y,用提供的标签表示10次观测的z坐标,或对最后10次观测使用相同的标签。这些方法对我来说似乎是合法的


可能采样频率不必要太高,因此您可以假设标签不会很快更改。但这也取决于手头的问题。

您的数据来自哪里?也许有一个解释,为什么每10次观察才有一个标签。或者,您可以假设标签在10次观察中保持不变,即最多每10个时间步更改一次。可能采样频率太高了。是的,数据描述中说加速度计是以高频采样的。我添加了一个“编辑”来突出显示这一点