Pandas 添加statsmodels';预测';将结果添加到数据帧

Pandas 添加statsmodels';预测';将结果添加到数据帧,pandas,dataframe,linear-regression,prediction,statsmodels,Pandas,Dataframe,Linear Regression,Prediction,Statsmodels,通常希望将预测结果附加到用于进行预测的数据集,但是statsmodelspredict函数返回的(非索引)结果的长度可能与预测所基于的数据集的长度不同 例如,如果测试数据集test,包含任何空条目,则 mod_fit = sm.Logit.from_formula('Y ~ A B C', train).fit() press = mod_fit.predict(test) 将生成一个长度小于test的数组,并且不能有效地附加 test['preds'] = preds 而且由于predic

通常希望将预测结果附加到用于进行预测的数据集,但是statsmodels
predict
函数返回的(非索引)结果的长度可能与预测所基于的数据集的长度不同

例如,如果测试数据集
test
,包含任何空条目,则

mod_fit = sm.Logit.from_formula('Y ~ A B C', train).fit()
press = mod_fit.predict(test)
将生成一个长度小于
test
的数组,并且不能有效地附加

test['preds'] = preds
而且由于
predict
的结果没有索引,因此无法恢复结果应该附加到的行


predict
结果与生成结果的行关联的惯用用法是什么?是否有一种方法可以让
predict
返回保留其参数索引的数据帧?

predict不应删除任何行。你能给出一个发生这种情况的最简单的工作示例吗?保护熊猫指数是我的雷达,应该很快在硕士固定


编辑:不必担心。这是一个众所周知的问题

为什么预测会以这种方式工作?为什么不返回一个数据帧,该数据帧的索引与进行预测的行的索引相匹配?您使用的是什么版本的statsmodels?我尝试了
0.6.0.dev
,虽然没有返回数据帧,但缺少的值不会从预测输出中删除。@behzad.nouri:So in
0.6.0.dev
len(train)==len(preds)
,而不考虑
序列中缺少的值
?当
列中缺少值时,按
返回什么?酷。只要它是已知的,而不是我没有掌握的哲学的某一部分。我期待最新消息。对时间表有什么想法吗?