朴素贝叶斯分类器中的Python偏度和峰度

朴素贝叶斯分类器中的Python偏度和峰度,python,math,statistics,cdf,kurtosis,Python,Math,Statistics,Cdf,Kurtosis,我正在用Python创建一个朴素的贝叶斯分类器,它将能够根据某一天的一些天气数据猜测它的月份 目前,平均值和标准偏差用于对月份进行分类,但我认为增加偏度和峰度可能有助于提高准确性 我目前正在使用scipy.stats.norm.cdf来计算概率,但在Python中似乎找不到任何考虑偏度和峰度的cdf函数 我觉得我可能没有正确理解偏度和峰度。偏度和峰度对cdf函数有影响,因此我希望它们作为参数给出 我对偏度、峰度和cdf函数的理解有什么根本性的错误吗?如果没有,那么我在哪里可以找到Python中考

我正在用Python创建一个朴素的贝叶斯分类器,它将能够根据某一天的一些天气数据猜测它的月份

目前,平均值和标准偏差用于对月份进行分类,但我认为增加偏度和峰度可能有助于提高准确性

我目前正在使用scipy.stats.norm.cdf来计算概率,但在Python中似乎找不到任何考虑偏度和峰度的cdf函数

我觉得我可能没有正确理解偏度和峰度。偏度和峰度对cdf函数有影响,因此我希望它们作为参数给出


我对偏度、峰度和cdf函数的理解有什么根本性的错误吗?如果没有,那么我在哪里可以找到Python中考虑所有这些参数的cdf函数的实现?

正态分布,您使用(scipy.stats.norm)在朴素贝叶斯中,典型的一维条件分布模型是由两个参数明确定义的——its
mean
std
。指定偏度/峰度没有意义,因为它们对于您的分布是恒定的(尤其是峰度为3)

您所考虑的可能是皮尔逊分布,它用于拟合更多的矩(均值、标准差、偏度和峰度)


这可能无法解决您的问题,但请看一看:在正态分布中,偏度和峰度都为零,因此,如果您希望以某种方式从这些参数定义分布,则必须使用不同类型的分布。