Java 什么';使用WEKAAPI对高维整数向量进行分类的最佳方法是什么?
我有一些整数的高维(30000维)向量。我有两门课:[是,不是]。我有6000个是类的样品和50000个非类的样品。我想训练一个分类器,将来自动将新样本分类到其中一个类中 我知道如何使用wekajavaapi,但我不确定使用哪种算法。有人能就以下问题给我一些建议吗Java 什么';使用WEKAAPI对高维整数向量进行分类的最佳方法是什么?,java,classification,weka,bayesian,decision-tree,Java,Classification,Weka,Bayesian,Decision Tree,我有一些整数的高维(30000维)向量。我有两门课:[是,不是]。我有6000个是类的样品和50000个非类的样品。我想训练一个分类器,将来自动将新样本分类到其中一个类中 我知道如何使用wekajavaapi,但我不确定使用哪种算法。有人能就以下问题给我一些建议吗 向量的维数是否太高,或者我是否有太多的样本在Weka中无法有效地执行此操作 我应该在开始之前降低维度吗?我可以使用什么算法来识别特征向量的重要元素 哪种分类器最适合对此类数据进行分类?我认为决策树应该可以很好地工作,但也许朴素的贝叶斯