Python 连续三维变量的离散化
我目前正在研究具有三维连续变量(x,y,z)的机器学习分类问题,我还想添加时间(t),它已经是一个离散变量。我的数据将是什么样子的示例:Python 连续三维变量的离散化,python,machine-learning,classification,discretization,Python,Machine Learning,Classification,Discretization,我目前正在研究具有三维连续变量(x,y,z)的机器学习分类问题,我还想添加时间(t),它已经是一个离散变量。我的数据将是什么样子的示例: x y z t [0.1 ,2.6, 0.0] [0.1 ,2.0, -3.0] [0.0 ,5.6, 5.0] 1486033702474 取每个连续变量的平均值就足够了吗? 请问如何表示/格式化这些变量,以
x y z t
[0.1 ,2.6, 0.0] [0.1 ,2.0, -3.0] [0.0 ,5.6, 5.0] 1486033702474
取每个连续变量的平均值就足够了吗?
请问如何表示/格式化这些变量,以便在Python的任何ML库中形成我的训练数据集?计算中的变量总是离散的。“连续”一词根本不适用,因为计算机是数字机器,因此只能以有限的速率采集数据。如果您想降低数据的粒度,根据您的情况,采用平均值将是一个有效的选择。采用Python中数据列表的平均值:
mean_x = sum(x) * 1. / len(x)
你能澄清一下数据类型吗。时间上的第一个向量是x还是每个元素对应于x,y,z?扩展你的数据…@mik all elements(x,y,z)将根据时间范围(比如t2-t1193)生成相同大小的向量,我将尝试一下,看看是否出现了有意义的结果。如果它没有按预期工作,请返回并思考变量表示什么。试着找出它们的核心意思。这是含糊不清的,但在这一领域中,需要对数学进行一定的调整