Statistics 解释规范化_Statistics_Linear Regression_Normalization_Scaling

Statistics 解释规范化

statistics

Statistics 解释规范化,statistics,linear-regression,normalization,scaling,Statistics,Linear Regression,Normalization,Scaling,1.）在线性回归中，当因变量被归一化（y-min/范围）使其在0-1范围内时，模型的输出是否可以解释为概率例如，如果我的因变量（y）被归一化，并且我拟合了一个带有数字特征/预测值的线性回归模型，那么预测（y_hat）也将在0-1之间。我的问题是我能把这个预测解释为概率吗。意思是>=0.5=成功，

1.）在线性回归中，当因变量被归一化（y-min/范围）使其在0-1范围内时，模型的输出是否可以解释为概率

例如，如果我的因变量（y）被归一化，并且我拟合了一个带有数字特征/预测值的线性回归模型，那么预测（y_hat）也将在0-1之间。我的问题是我能把这个预测解释为概率吗。意思是>=0.5=成功，<0.5=失败

2.）另一种情况：如果我的因变量和自变量在线性回归模型中都是标准化的（（最小值）/范围），我如何解释模型输出

3.）我开发了一个线性回归模型，具有标准化（y-min/范围）因变量和标准化（x-mean/SD）特征/协变量。当我在未用于训练模型的新数据集中测试此模型时，是否还需要标准化测试数据中的特征/协变量

另外，如何解释模型输出

4.）如果因变量（Y）和自变量（X）都被标准化（X-平均值/SD），模型如何解释

可能不会，普通/OLS线性回归从-Inf到+Inf，因此您希望使用一个广义线性回归，并用适当的“族”参数化，该族在线性回归的+Inf世界和[0,1]概率空间之间提供“链接”。R为这种情况提供了一个“准多项式”族，并为此使用了一个函数

取决于。。。你为什么要“标准化”？它不像神经网络那样需要。模型的每一个方面都设计成很好的凸面，因此易于优化。NNs往往不是凸面的，因此更难优化，因此进行了规范化/标准化以帮助解决问题

为了使预测有意义，您可能需要跟踪原始/训练数据使用的变换（即函数和参数），并将其应用于测试数据。如果您使用测试数据集中的最小/范围进行标准化，那么您可能会做错误的事情。也就是说，在某些情况下，如果相反的说法是正确的，我会鼓励你通过数学学习，看看它如何适用于你的情况

和上面一样，只是移动了一下。系数现在只是根据平均值的SDs来表示，但使用有助于解释的单位可能更容易

可能是解决这类问题的好地方…

不是编程问题，因此可以说是离题了；更适合于。