Statistics 不存储输入数据的多元线性回归R平方

Statistics 不存储输入数据的多元线性回归R平方,statistics,scipy,Statistics,Scipy,对于如何在不保存输入数据的情况下进行多元普通线性回归(并获得结果的R平方),任何人都有很好的参考。用例是一个包含太多行的数据集,无法存储。回归可以通过累加x[i]*x[j]和y*x[i]得到,然后从那里做矩阵数学,但是我找不到一个类似的公式来得到统计数据。谢谢。我没有好的推荐信,但我的方法是 展开平方表达式的和,并写出它们 就你积累的期望而言 我使用表示对数据行进行平均, 因此,是y值的平均值, 等等 在任何时候,我们都可以得到回归系数a[i]和b 从矩阵和向量,如您在问题中所示 下面我将使用

对于如何在不保存输入数据的情况下进行多元普通线性回归(并获得结果的R平方),任何人都有很好的参考。用例是一个包含太多行的数据集,无法存储。回归可以通过累加x[i]*x[j]和y*x[i]得到,然后从那里做矩阵数学,但是我找不到一个类似的公式来得到统计数据。谢谢。

我没有好的推荐信,但我的方法是 展开平方表达式的和,并写出它们 就你积累的期望而言

  • 我使用
    表示对数据行进行平均, 因此,
    是y值的平均值, 等等

  • 在任何时候,我们都可以得到回归系数a[i]和b 从矩阵
    和向量
    ,如您在问题中所示

  • 下面我将使用
    sum_I{a[I]*x[I]}
    来指示组件上的和 这包括自变量
  • 设N为使用的数据行数
计算解释均方偏差的一种方法是:

SS_reg/N = < (f -<y> )^2 >    

         = < ( sum_i {a[i]*x[i] } + b - <y> )^2 > 
         = < sum_i { a[i]^2*x[i]^2}  +b^2 +<y>^2 +sum_i{ 2*b*a[i]*x[i]}-2*<y>* sum_i{a[i]*x[i]}-2*b*<y> >
         = sum_i { a[i]^2*<x[i]*x[i]> } +
           b^2 +
           <y>^2 + 
           2*b*sum_i{a[i]*<x[i]>} -
           2*<y>*sum_i{ a[i]*<x[i]>} -
           2*b*<y>
SS\u reg/N=<(f-^2>
=<(和{a[i]*x[i]}+b-^2>
=
=和{a[i]^2*}+
b^2+
^2 + 
2*b*sum_i{a[i]*}-
2**sum_i{a[i]*}-
2*b*
您已经将
作为 推导回归系数。 您还需要保持自变量的平均值 (
用于每个
i
)以及因变量(

可以对总均方或剩余均方进行类似的扩展 错误,然后用于计算R^2值