Neural network 我应该在模式分类中使用多少主成分?

Neural network 我应该在模式分类中使用多少主成分?,neural-network,classification,pca,pattern-recognition,Neural Network,Classification,Pca,Pattern Recognition,我正在研究神经网络,目前我正在创建一个感知器,它将用作人脸图像数据集的分类器。在将样本分为两组进行训练和测试之前,我需要对我的数据集执行pca(主成分分析)。通过这样做,我降低了数据的维数,同时压缩了图像的大小 然而,我不是一名统计学家,在没有任何具体公式的情况下,我在定义pca方法使用的主成分数量时遇到一些问题。我的数据集是一个4096x400的数组,400是样本图像的数量,4096是它们的维度。在主成分分析过程中,是否有更精确和准确的主成分数量的方法 我在matlab上工作,所以我在使用pr

我正在研究神经网络,目前我正在创建一个感知器,它将用作人脸图像数据集的分类器。在将样本分为两组进行训练和测试之前,我需要对我的数据集执行pca(主成分分析)。通过这样做,我降低了数据的维数,同时压缩了图像的大小

然而,我不是一名统计学家,在没有任何具体公式的情况下,我在定义pca方法使用的主成分数量时遇到一些问题。我的数据集是一个4096x400的数组,400是样本图像的数量,4096是它们的维度。在主成分分析过程中,是否有更精确和准确的主成分数量的方法

我在matlab上工作,所以我在使用princomp。提前感谢您,我们将非常感谢您的帮助。

问题:我应该在模式分类中使用多少主成分? 回答:尽可能低。 应用主成分分析时,根据数据得到主成分的数量。假设从数据中得到10个主成分。您将控制用主成分解释方差的程度

比如说

  component  variance explained
  1          0.40
  2          0.25
  3          0.15
  4          0.10
  5          0.05
  6          0.01
  7          0.01
  8          0.01         
  9          0.01         
  10         0.01         
有了这个,您就可以决定截止数字并训练分类器。在本例中,如您所见,前4个主成分包含90%的信息。您的结果可能足够好,只有4个主成分

您可以添加第5个主成分,这5个主成分将保存您信息的%95,依此类推

请参见带有