Machine learning 朴素贝叶斯分类中概率的计算

Machine learning 朴素贝叶斯分类中概率的计算,machine-learning,statistics,classification,probability,naivebayes,Machine Learning,Statistics,Classification,Probability,Naivebayes,我有一个由分类属性和连续属性组成的数据集。我想应用朴素贝叶斯分类方法对数据进行分类 如何计算这两种类型的概率 我是否应该使用计数方法计算分类数据,并假设一些分布,然后从连续数据的分布进行计算?因为朴素贝叶斯假设在给定类标签的情况下,每个特征观察都是独立的 P(cat1, con1|y) = P(cat1|y)P(con1|y) 如果cat1是一些分类变量,而con1是连续的,则可以完全独立地对这些概率进行建模。正如你所建议的,对于分类,你可以使用简单的经验估计器(但是记住一些平滑技术,所以你

我有一个由分类属性和连续属性组成的数据集。我想应用朴素贝叶斯分类方法对数据进行分类

如何计算这两种类型的概率


我是否应该使用计数方法计算分类数据,并假设一些分布,然后从连续数据的分布进行计算?

因为朴素贝叶斯假设在给定类标签的情况下,每个特征观察都是独立的

P(cat1, con1|y) =  P(cat1|y)P(con1|y)
如果
cat1
是一些分类变量,而
con1
是连续的,则可以完全独立地对这些概率进行建模。正如你所建议的,对于分类,你可以使用简单的经验估计器(但是记住一些平滑技术,所以你不会得到0概率),对于连续,你需要一些更复杂的估计器(如使用固定分布族的最大似然估计(MLE)——例如高斯分布;或更复杂的东西——如任何概率分类器/模型)