Statistics 不存储输入数据的多元线性回归R平方
对于如何在不保存输入数据的情况下进行多元普通线性回归(并获得结果的R平方),任何人都有很好的参考。用例是一个包含太多行的数据集,无法存储。回归可以通过累加x[i]*x[j]和y*x[i]得到,然后从那里做矩阵数学,但是我找不到一个类似的公式来得到统计数据。谢谢。我没有好的推荐信,但我的方法是 展开平方表达式的和,并写出它们 就你积累的期望而言Statistics 不存储输入数据的多元线性回归R平方,statistics,scipy,Statistics,Scipy,对于如何在不保存输入数据的情况下进行多元普通线性回归(并获得结果的R平方),任何人都有很好的参考。用例是一个包含太多行的数据集,无法存储。回归可以通过累加x[i]*x[j]和y*x[i]得到,然后从那里做矩阵数学,但是我找不到一个类似的公式来得到统计数据。谢谢。我没有好的推荐信,但我的方法是 展开平方表达式的和,并写出它们 就你积累的期望而言 我使用表示对数据行进行平均, 因此,是y值的平均值, 等等 在任何时候,我们都可以得到回归系数a[i]和b 从矩阵和向量,如您在问题中所示 下面我将使用
- 我使用
表示对数据行进行平均, 因此,
是y值的平均值, 等等 - 在任何时候,我们都可以得到回归系数a[i]和b
从矩阵
和向量
,如您在问题中所示 - 下面我将使用
来指示组件上的和 这包括自变量sum_I{a[I]*x[I]}
- 设N为使用的数据行数
SS_reg/N = < (f -<y> )^2 >
= < ( sum_i {a[i]*x[i] } + b - <y> )^2 >
= < sum_i { a[i]^2*x[i]^2} +b^2 +<y>^2 +sum_i{ 2*b*a[i]*x[i]}-2*<y>* sum_i{a[i]*x[i]}-2*b*<y> >
= sum_i { a[i]^2*<x[i]*x[i]> } +
b^2 +
<y>^2 +
2*b*sum_i{a[i]*<x[i]>} -
2*<y>*sum_i{ a[i]*<x[i]>} -
2*b*<y>
SS\u reg/N=<(f-^2>
=<(和{a[i]*x[i]}+b-^2>
=
=和{a[i]^2*}+
b^2+
^2 +
2*b*sum_i{a[i]*}-
2**sum_i{a[i]*}-
2*b*
您已经将
作为
推导回归系数。
您还需要保持自变量的平均值
(
用于每个i
)以及因变量(
)
可以对总均方或剩余均方进行类似的扩展
错误,然后用于计算R^2值