Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/327.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python PCA与朴素贝叶斯分类器_Python_Machine Learning_Pca_Naivebayes - Fatal编程技术网

Python PCA与朴素贝叶斯分类器

Python PCA与朴素贝叶斯分类器,python,machine-learning,pca,naivebayes,Python,Machine Learning,Pca,Naivebayes,我正在Python中试验PCA和朴素贝叶斯分类器 简而言之,使用一个数字灰度图像数据库,我用PCA降维,然后用朴素贝叶斯分类 我分别使用2,4,10,30,60200500784个组件。 我得到的分类错误率分别是: 0.258064452、0.15322581、0.06290323、0.06451613、0.06451613、0.10322581、0.28064516和0.31774194。我认为采用更多的成分总是可以提高分类的准确性。这是真的吗?如果是这样,那我就做错了 我不认为你的问题有一个

我正在Python中试验PCA和朴素贝叶斯分类器

简而言之,使用一个数字灰度图像数据库,我用PCA降维,然后用朴素贝叶斯分类

我分别使用2,4,10,30,60200500784个组件。 我得到的分类错误率分别是:
0.258064452、0.15322581、0.06290323、0.06451613、0.06451613、0.10322581、0.28064516和0.31774194。我认为采用更多的成分总是可以提高分类的准确性。这是真的吗?如果是这样,那我就做错了

我不认为你的问题有一个单一的有效答案,但是降低你输入的维度可以防止过度拟合。更多的功能并不总是使分类器更准确。你可以在这里找到详细的解释:

我认为你的问题没有一个单一的有效答案,但是降低输入的维度可以防止过度拟合。更多的功能并不总是使分类器更准确。您可以在此处查看详细解释:

减少尺寸确实可以减少过度拟合,但如果不向数据集添加其他数据,则始终存在最佳组件数,从而提供最佳精度。在您的例子中,它是10,因为它给出的错误率最小,为
0.06290323
。因此,如果要增加维度,还应该增加用于训练的数据集,以期望更高的准确性。否则,您应该尝试靠近它以获得更高的准确性

此外,如果您的数据集是平衡的,那么
准确性
可能是评估您绩效的一个很好的衡量标准。如果数据集不平衡,请尝试,或


如果仍然对分类器不满意,请使用其他分类算法。

减少维度确实可以减少过度拟合,但始终存在最佳组件数,如果不向数据集添加其他数据,则可以获得最佳精度。在您的例子中,它是10,因为它给出的错误率最小,为
0.06290323
。因此,如果要增加维度,还应该增加用于训练的数据集,以期望更高的准确性。否则,您应该尝试靠近它以获得更高的准确性

此外,如果您的数据集是平衡的,那么
准确性
可能是评估您绩效的一个很好的衡量标准。如果数据集不平衡,请尝试,或

如果仍然对分类器不满意,请使用其他分类算法