Python scikit学习中不同数据子集的回归_Python_Machine Learning_Regression

Python scikit学习中不同数据子集的回归

python machine-learning

Python scikit学习中不同数据子集的回归,python,machine-learning,regression,Python,Machine Learning,Regression,我试图估计一些权重，但数据集中的每个条目每次只包含“活动”权重的子集。我觉得这应该很容易，但我一直在思考如何构造问题数据来自一个物理过程，其中N个闸门分别允许不同的流量。但是，在整个数据集上，每个闸门的流量不应显著波动。每个可用数据点包含：闸门的开/关状态整个系统的总流量总流量只是通过闸门的流量总和所以我想说： configs=np.array([ [1,0,0,0], [1,1,0,0], [1,1,1,0], [1,0,0,1], [1,1,0,1], [1,1,1,1] ]

我试图估计一些权重，但数据集中的每个条目每次只包含“活动”权重的子集。我觉得这应该很容易，但我一直在思考如何构造问题

数据来自一个物理过程，其中N个闸门分别允许不同的流量。但是，在整个数据集上，每个闸门的流量不应显著波动。每个可用数据点包含：

闸门的开/关状态
整个系统的总流量

总流量只是通过闸门的流量总和

所以我想说：

configs=np.array([
[1,0,0,0], [1,1,0,0], [1,1,1,0],
[1,0,0,1], [1,1,0,1], [1,1,1,1]  ])
总计=np.array([[
2003, 236851, 393559,
5759, 238656, 395060 ]])

我试图将其作为联立线性方程组的基本系统来解决，因为数据点（即方程）比门的数量（即未知数）多得多。我可以对每个不同的数据点这样做，然后平均每个门的权重

有没有一种方法可以将其设置为回归问题，或者一个线性回归可以有效地完成我上面用联立方程所做的工作