Machine learning 解析计算Parzen窗的偏差_Machine Learning_Kernel Density_Probability Density

Machine learning 解析计算Parzen窗的偏差

machine-learning

Machine learning 解析计算Parzen窗的偏差,machine-learning,kernel-density,probability-density,Machine Learning,Kernel Density,Probability Density,我仍然很难理解一个特定估计器的偏差和方差到底是什么我正在研究维基百科上关于偏见的定义：如果我们将核密度估计定义为但我如何将其应用于内核密度估计，或者更准确地说，应用于Parzen窗口？至少有人能告诉我估计的密度f_hatx与偏差和方差的关系吗定性的，我已经知道，一个包含整个数据空间的框窗口将有最大的偏差，没有方差，因为估计的密度将只是整个训练数据集的平均值我想我是自己想出来的。密度估计情况下的参数θ为。。drumroll。。。密度函数fx。因此，偏差被定义为偏差=E[f_hatx]-

我仍然很难理解一个特定估计器的偏差和方差到底是什么

我正在研究维基百科上关于偏见的定义：

如果我们将核密度估计定义为

但我如何将其应用于内核密度估计，或者更准确地说，应用于Parzen窗口？至少有人能告诉我估计的密度f_hatx与偏差和方差的关系吗

定性的，我已经知道，一个包含整个数据空间的框窗口将有最大的偏差，没有方差，因为估计的密度将只是整个训练数据集的平均值

我想我是自己想出来的。密度估计情况下的参数θ为。。drumroll。。。密度函数fx。因此，偏差被定义为

偏差=E[f_hatx]-fx

E[f_hatx]项是窗口函数的期望值或平均值。计算它需要一个简单的积分

fx是数据的真实密度函数，实际上很可能是未知的