Python 三种朴素贝叶斯分类器的差异

Python 三种朴素贝叶斯分类器的差异,python,machine-learning,naivebayes,Python,Machine Learning,Naivebayes,对不起,有些语法错误和误用的话 我目前正在处理文本分类,试图对电子邮件进行分类 经过研究,我发现多项式朴素贝叶斯和贝努利朴素贝叶斯更常用于文本分类。 伯努利只关心这个词是否发生。 多项式关心单词出现的次数 对于高斯朴素贝叶斯,它通常用于连续数据和正态分布数据,例如:身高、体重 但是,我们不使用高斯朴素贝叶斯进行文本分类的原因是什么? 如果我们将其应用于文本分类,会发生任何不好的事情吗?贝叶斯分类器使用概率规则,您提到的三个规则与以下规则相关: 贝叶斯概率: 高斯分布: 伯努利分布: 多项式分布

对不起,有些语法错误和误用的话

我目前正在处理文本分类,试图对电子邮件进行分类

经过研究,我发现多项式朴素贝叶斯和贝努利朴素贝叶斯更常用于文本分类。 伯努利只关心这个词是否发生。 多项式关心单词出现的次数

对于高斯朴素贝叶斯,它通常用于连续数据和正态分布数据,例如:身高、体重 但是,我们不使用高斯朴素贝叶斯进行文本分类的原因是什么?
如果我们将其应用于文本分类,会发生任何不好的事情吗?

贝叶斯分类器使用概率规则,您提到的三个规则与以下规则相关:

  • 贝叶斯概率:
  • 高斯分布:
  • 伯努利分布:
  • 多项式分布:
您必须选择与您拥有的数据相关的概率规则(或全部尝试)


我认为你在网站上或研究论文中读到的内容与电子邮件数据通常遵循伯努利分布或多项式分布这一事实有关。你们可以,而且我鼓励你们尝试高斯分布,你们应该很快弄清楚你们的数据是否可以拟合高斯分布


但是,我建议您阅读上述链接,如果您对解决方案a或B优于解决方案C的原因有所了解,您将更好地了解您的工作。

请分享每个链接的相关部分。如果他们走下去,你的答案将毫无帮助。我不能更具体地说,他需要对这些分布有更广泛的了解。我会试试,不过,一个小编辑,我不确定这一点。设3为阳性文本中出现的“好”的平均数。如果“好”在测试用例中出现4次,则被视为比“好”出现3次的阳性程度低?^在高斯朴素贝叶斯中