Machine learning 解析计算Parzen窗的偏差

Machine learning 解析计算Parzen窗的偏差,machine-learning,kernel-density,probability-density,Machine Learning,Kernel Density,Probability Density,我仍然很难理解一个特定估计器的偏差和方差到底是什么 我正在研究维基百科上关于偏见的定义: 如果我们将核密度估计定义为 但我如何将其应用于内核密度估计,或者更准确地说,应用于Parzen窗口?至少有人能告诉我估计的密度f_hatx与偏差和方差的关系吗 定性的,我已经知道,一个包含整个数据空间的框窗口将有最大的偏差,没有方差,因为估计的密度将只是整个训练数据集的平均值 我想我是自己想出来的。密度估计情况下的参数θ为。。drumroll。。。密度函数fx。因此,偏差被定义为 偏差=E[f_hatx]-

我仍然很难理解一个特定估计器的偏差和方差到底是什么

我正在研究维基百科上关于偏见的定义:

如果我们将核密度估计定义为

但我如何将其应用于内核密度估计,或者更准确地说,应用于Parzen窗口?至少有人能告诉我估计的密度f_hatx与偏差和方差的关系吗


定性的,我已经知道,一个包含整个数据空间的框窗口将有最大的偏差,没有方差,因为估计的密度将只是整个训练数据集的平均值

我想我是自己想出来的。密度估计情况下的参数θ为。。drumroll。。。密度函数fx。因此,偏差被定义为

偏差=E[f_hatx]-fx

E[f_hatx]项是窗口函数的期望值或平均值。计算它需要一个简单的积分

fx是数据的真实密度函数,实际上很可能是未知的