Math Can';我不理解线性回归的成本函数

Math Can';我不理解线性回归的成本函数,math,machine-learning,linear-algebra,Math,Machine Learning,Linear Algebra,我真的不能理解下面的等式,尤其是1/(2m) 这个等式的目的是什么?那么1/(2m)来自哪里 J(theta_0, theta_1) = 1/(2m) * sum_(i=1)^m [ h_theta(x^i) - y^i ]^2 请解释一下。它是如何投射的 成本函数是 J(theta_0, theta_1) = 1/(2m) * sum_(i=1)^m [ h_theta(x^i) - y^i ]^2 通过h_θ(x^i)我们表示x^i的模型输出,因此h_θ(x^i)-y^i是它的错误(假设

我真的不能理解下面的等式,尤其是
1/(2m)

这个等式的目的是什么?那么
1/(2m)
来自哪里

J(theta_0, theta_1) = 1/(2m) * sum_(i=1)^m [ h_theta(x^i) - y^i ]^2
请解释一下。它是如何投射的

成本函数是

J(theta_0, theta_1) = 1/(2m) * sum_(i=1)^m [ h_theta(x^i) - y^i ]^2
通过
h_θ(x^i)
我们表示
x^i
的模型输出,因此
h_θ(x^i)-y^i
是它的错误(假设
y^i
是正确的输出)

现在,我们计算这个误差的平方(去掉符号,因为这个误差可能是正的也可能是负的)并在所有样本上求和,然后以某种方式限制它,我们对它进行归一化-只需除以
m
,我们就得到了平均值(因为我们是按样本数进行划分)平方(因为我们平方)误差(因为我们计算误差):


出现在前面的
2
仅用于简化导数,因为当您尝试最小化它时,您将使用基于此函数导数的最速下降法。
a^2
的导数是
2a
,我们的函数是某物的平方,所以这个
2
会抵消掉。这是其存在的唯一原因。

您希望构建一个模型,将误差均匀分布在数据点上,因此误差之和=0,误差平均值=0;您还应该构建误差最小的模型,这相当于最小化均方误差1/m * sum_(i=1)^m [ h_theta(x^i) - y^i ]^2