Statistics 解释规范化

Statistics 解释规范化,statistics,linear-regression,normalization,scaling,Statistics,Linear Regression,Normalization,Scaling,1.)在线性回归中,当因变量被归一化(y-min/范围)使其在0-1范围内时,模型的输出是否可以解释为概率 例如,如果我的因变量(y)被归一化,并且我拟合了一个带有数字特征/预测值的线性回归模型,那么预测(y_hat)也将在0-1之间。我的问题是我能把这个预测解释为概率吗。意思是>=0.5=成功,

1.)在线性回归中,当因变量被归一化(y-min/范围)使其在0-1范围内时,模型的输出是否可以解释为概率

例如,如果我的因变量(y)被归一化,并且我拟合了一个带有数字特征/预测值的线性回归模型,那么预测(y_hat)也将在0-1之间。我的问题是我能把这个预测解释为概率吗。意思是>=0.5=成功,<0.5=失败

2.)另一种情况:如果我的因变量和自变量在线性回归模型中都是标准化的((最小值)/范围),我如何解释模型输出

3.)我开发了一个线性回归模型,具有标准化(y-min/范围)因变量和标准化(x-mean/SD)特征/协变量。当我在未用于训练模型的新数据集中测试此模型时,是否还需要标准化测试数据中的特征/协变量

另外,如何解释模型输出

4.)如果因变量(Y)和自变量(X)都被标准化(X-平均值/SD),模型如何解释

  • 可能不会,普通/OLS线性回归从-Inf到+Inf,因此您希望使用一个广义线性回归,并用适当的“族”参数化,该族在线性回归的+Inf世界和[0,1]概率空间之间提供“链接”。R为这种情况提供了一个“准多项式”族,并为此使用了一个函数

  • 取决于。。。你为什么要“标准化”?它不像神经网络那样需要。模型的每一个方面都设计成很好的凸面,因此易于优化。NNs往往不是凸面的,因此更难优化,因此进行了规范化/标准化以帮助解决问题

  • 为了使预测有意义,您可能需要跟踪原始/训练数据使用的变换(即函数和参数),并将其应用于测试数据。如果您使用测试数据集中的最小/范围进行标准化,那么您可能会做错误的事情。也就是说,在某些情况下,如果相反的说法是正确的,我会鼓励你通过数学学习,看看它如何适用于你的情况

  • 和上面一样,只是移动了一下。系数现在只是根据平均值的SDs来表示,但使用有助于解释的单位可能更容易

  • 可能是解决这类问题的好地方…

    不是编程问题,因此可以说是离题了;更适合于。