Machine learning 试图理解线性回归中的期望值

Machine learning 试图理解线性回归中的期望值,machine-learning,linear-regression,probability,Machine Learning,Linear Regression,Probability,我很难理解学校机器学习课程中的讲义幻灯片 为什么Y=f(X)的期望值是?这是什么意思 我的理解是,X,Y是向量,f(X)输出Y的向量,其中Y向量中的每个单独值(Y_i)对应于f(X_i),其中X_i是索引i处X中的值;但是现在取Y的期望值,它将是一个单一的值,那么它如何等于f(X) 十、 Y(大写)是向量 x_i,y_i(小写加下标)是x,y中索引i处的标量,这里有很多混淆。首先让我们从定义开始 定义 期望运算符E[.]:将一个随机变量作为输入,并给出一个标量/向量作为输出。假设Y是一个正态分

我很难理解学校机器学习课程中的讲义幻灯片

为什么Y=f(X)的期望值是?这是什么意思

我的理解是,X,Y是向量,f(X)输出Y的向量,其中Y向量中的每个单独值(Y_i)对应于f(X_i),其中X_i是索引i处X中的值;但是现在取Y的期望值,它将是一个单一的值,那么它如何等于f(X)

十、 Y(大写)是向量


x_i,y_i(小写加下标)是x,y中索引i处的标量,这里有很多混淆。首先让我们从定义开始

定义
  • 期望运算符E[.]:将一个随机变量作为输入,并给出一个标量/向量作为输出。假设Y是一个正态分布的随机变量,具有平均μ和方差σ^{2}(通常表示为: Y~N(Mu,Sigma^{2}),则E[Y]=Mu

  • 函数f(.):取一个标量/向量(不是随机变量)并给出一个标量/向量。在本文中,它是一个仿射函数,即f(X)=a*X+b,其中a和b是固定常数

  • 发生什么事 现在您可以从两个角度查看线性回归

    统计视图 一个角度假设您的响应变量-Y-是正态分布的随机变量,因为:

    Y~a*X+b+ε

    在哪里

    ε~N(0,σ^sq)

    X是另一个分布。我们并不关心X是如何分布的,也不关心它是如何被给定的。在这种情况下,条件分布是

    Y | X~N(a*X+b,σ^sq)

    注意这里a,b和X也是一个数字,它们没有随机性

    数学观 另一种观点是数学观点,其中我假设有一个函数f(.)控制着现实生活中的过程,如果在现实生活中我观察到X,那么f(X)应该是输出。当然,情况并非如此,偏差被认为是由于各种原因造成的,如量规误差等。这种说法是,该函数是线性的: f(X)=a*X+b

    合成 现在我们如何将这些结合起来?好的,如下所示: E[Y | X]=a*X+b=f(X)

    关于你的问题,我首先想挑战它应该是Y | X,而不是Y本身

    第二,关于每个术语在现实生活中所代表的内容,存在大量可能的本体论讨论。X,Y(大写)可以是向量。X,Y(大写)也可以是随机变量。这些随机变量的样本可能存储在向量中,并且两者都用大写字母表示(最好的方法是使用不同的字体)。在这种情况下,您的样本将成为您的数据。有关模型的总体视图及其与现实生活的相关性的讨论应在随机变量级别上进行。推断参数的方法、线性回归算法的工作原理应在矩阵和向量级别上进行。可能还有其他讨论,您应关注b其他


    我希望这个过于杂乱无章的答案能帮助你。一般来说,如果你想学习这些东西,一定要知道你在处理什么类型的数学对象和运算符,它们作为输入是什么,它们与现实生活有什么关联。

    如果X代表标量,Y代表标量。如果X代表向量,Y代表向量。所以根据讨论的上下文,向量或标量,这两种含义在各自的上下文中都是正确的。@JamesPhillips你能解释一下为什么它是正确的吗?我们说的方程“y=m*x+b”是怎么回事,我想知道当x=5时y的值。这是一个单一的标量值,如果我们都理解这一点,一切都会好起来。如果我们讨论x的向量或值数组,比如[1,2,3,4]y也是一个向量,如果我们在讨论中都理解了这一点,那也没问题。只要我们都同意讨论的内容是关于向量还是标量的,我们就可以毫无问题地交流我们的想法。@JamesPhillips我相信X和y是向量,X_I和y_I是索引I处的标量值,对不起如果不清楚的话。你能解释一下为什么Y的期望值等于f(X),那么E(Y)=f(X)的确切含义是什么?我还没有看到符号E(Y)=f(X)。也许E代表期望值,这可能有意义。