Python scikit学习中不同数据子集的回归

Python scikit学习中不同数据子集的回归,python,machine-learning,regression,Python,Machine Learning,Regression,我试图估计一些权重,但数据集中的每个条目每次只包含“活动”权重的子集。我觉得这应该很容易,但我一直在思考如何构造问题 数据来自一个物理过程,其中N个闸门分别允许不同的流量。但是,在整个数据集上,每个闸门的流量不应显著波动。每个可用数据点包含: 闸门的开/关状态 整个系统的总流量 总流量只是通过闸门的流量总和 所以我想说: configs=np.array([ [1,0,0,0], [1,1,0,0], [1,1,1,0], [1,0,0,1], [1,1,0,1], [1,1,1,1] ]

我试图估计一些权重,但数据集中的每个条目每次只包含“活动”权重的子集。我觉得这应该很容易,但我一直在思考如何构造问题

数据来自一个物理过程,其中N个闸门分别允许不同的流量。但是,在整个数据集上,每个闸门的流量不应显著波动。每个可用数据点包含:

  • 闸门的开/关状态
  • 整个系统的总流量
总流量只是通过闸门的流量总和

所以我想说:

configs=np.array([
[1,0,0,0], [1,1,0,0], [1,1,1,0],
[1,0,0,1], [1,1,0,1], [1,1,1,1]  ])
总计=np.array([[
2003, 236851, 393559,
5759, 238656, 395060 ]])
我试图将其作为联立线性方程组的基本系统来解决,因为数据点(即方程)比门的数量(即未知数)多得多。我可以对每个不同的数据点这样做,然后平均每个门的权重

有没有一种方法可以将其设置为回归问题,或者一个线性回归可以有效地完成我上面用联立方程所做的工作