Python 用pandas并行训练OLS模型
我想用熊猫训练多个OLS模型(事实上,总数约为500个)。我可以成批地做这个吗 这是一个简化的例子,我想训练5个模型,比如m1,m2,m3,m4,m5。 每个模型都有4个自由度。 我不想顺序地训练m1到m5,而是想把所有的Y数据组织成一个Python 用pandas并行训练OLS模型,python,numpy,pandas,Python,Numpy,Pandas,我想用熊猫训练多个OLS模型(事实上,总数约为500个)。我可以成批地做这个吗 这是一个简化的例子,我想训练5个模型,比如m1,m2,m3,m4,m5。 每个模型都有4个自由度。 我不想顺序地训练m1到m5,而是想把所有的Y数据组织成一个数据帧 def makeDataFrame(): return pandas.DataFrame( data={ 'm1':range(10), 'm2':range(10),
数据帧
def makeDataFrame():
return pandas.DataFrame(
data={
'm1':range(10),
'm2':range(10),
'm3':range(10, 20),
'm4':range(20, 30),
'm5':range(30, 40)})
Y = makeDataFrame()
:
然后将每个Y对应的所有X收集到面板中
X = pandas.Panel({'A':makeDataFrame(), 'B':makeDataFrame(), 'C':makeDataFrame()})
然后使用pandas.ols(y=y,x=x)
同时获得m1-m5的五个模型(所有五个模型的形式都是y~A+B+C+截距)。
从我的实验来看,上述代码不能满足我的要求。
还有别的选择吗
熊猫有可能吗?你能展示一些你如何组织计算的代码吗?除了pandas,您还使用哪些库?@logc hi,更新问题。谢谢你抽出时间
Y
和X
似乎包含相同的数据(使用makeDataFrame
生成)。这是故意的吗?@Eikenberg不,X和Y的真实数据不一定相等。谢谢。你能把这说清楚吗?我很难理解你想做什么。据我所知,你似乎有一个目标的几个模型?(对于多个目标的一个模型,肯定有一个解决方案)
X = pandas.Panel({'A':makeDataFrame(), 'B':makeDataFrame(), 'C':makeDataFrame()})