Machine learning 朴素贝叶斯密度估计

Machine learning 朴素贝叶斯密度估计,machine-learning,naivebayes,probability-density,Machine Learning,Naivebayes,Probability Density,我目前正在为一个机器学习考试而学习,在谷歌搜索和研究了很多幻灯片之后,我仍然不能完全确定朴素贝叶斯密度估计器是如何工作的。有人能给我解释一下吗?这门课还是很基础的,所以如果可能的话,请保持简单:) 这是一个我一直坚持的旧考试的问题: 在表1中为“赢”类训练的朴素贝叶斯密度估计器会对一个案例(x1=I,x3=C)预测什么 表1: 答案显然是:(3/5)*(1/5)=0,12。但是3/5和1/5是从哪里来的呢 谢谢你的帮助 朴素贝叶斯使用两种假设: 给定一个类,特性是独立的 每个特征都来自一些已

我目前正在为一个机器学习考试而学习,在谷歌搜索和研究了很多幻灯片之后,我仍然不能完全确定朴素贝叶斯密度估计器是如何工作的。有人能给我解释一下吗?这门课还是很基础的,所以如果可能的话,请保持简单:)

这是一个我一直坚持的旧考试的问题:

在表1中为“赢”类训练的朴素贝叶斯密度估计器会对一个案例(x1=I,x3=C)预测什么

表1:

答案显然是:(3/5)*(1/5)=0,12。但是3/5和1/5是从哪里来的呢


谢谢你的帮助

朴素贝叶斯使用两种假设:

  • 给定一个类,特性是独立的
  • 每个特征都来自一些已知的apriori密度族
它给了我们什么?首先,让我们使用第一个假设

P(x1=I, x3=C | y = Win) = P(x1=I | y=Win) P(x3=C | y=Win)
现在我们必须计算每一个“小”概率,我们使用条件概率的定义和一个简单的频率分析方法,通过估计

               P(x=A, y=B)   # samples having x=A and y=B
P(x=A | y=B) = ----------- = ----------------------------
                  P(y=B)         # samples having y=B

\________________________/
   definition of P(a|b)

               \________________________________________/
                    estimator for the assumed family
因此


欢迎来到SO。这个问题与编程无关——我建议在交叉验证上发布。
P(x1=I | y=Win) = 3/5
P(x3=C | y=Win) = 1/5