Nlp WEKA中SVM训练的标称属性中标称值的最大数量是多少?

Nlp WEKA中SVM训练的标称属性中标称值的最大数量是多少?,nlp,weka,svm,libsvm,Nlp,Weka,Svm,Libsvm,我有一个NLP问题,我计划用支持向量机在WEKA中进行分类。 我试图对单词进行分类——POS标记集有24个标记,基本短语块BPC标记集有15个标记 但我有一些特征集,我希望每个单词都能根据其特征进行分类 第一个特性集是{POS},因此标称属性POS将有24个标称值。 第二个是{POS+BPC},因此POS+BPC nominal属性的标称值为24*15=375 例如,一个单词可以这样输出,每个名词属性都被分类: word, POS=tag1, POS+BPC=tag234 我只是想知道这是否可

我有一个NLP问题,我计划用支持向量机在WEKA中进行分类。 我试图对单词进行分类——POS标记集有24个标记,基本短语块BPC标记集有15个标记

但我有一些特征集,我希望每个单词都能根据其特征进行分类

第一个特性集是{POS},因此标称属性POS将有24个标称值。 第二个是{POS+BPC},因此POS+BPC nominal属性的标称值为24*15=375

例如,一个单词可以这样输出,每个名词属性都被分类:

word, POS=tag1, POS+BPC=tag234
我只是想知道这是否可能?对于一个标称属性,我可以拥有的标称值的最大类数是多少?因为我可能会使用更多的标记集和组合。我需要使用LibSVM包吗?使用支持向量机解决这个多类问题有意义吗


我的训练数据集约为288K单词,测试数据集约为35k单词。

我认识一个人,他拥有300万个功能,并使用weka构建分类器。但他必须将提供给weka的内存从1GB增加到3MB。与他的设置相比,您有2个功能,但有3位数的值范围。我相信除了记忆问题之外,不应该有任何问题。Weka是一个大型采矿工作台。你为什么不运行一些样本作为一个健全的测试,给我们一个提示呢?

你对单词class的使用非常混乱。你指的是名义价值;课程是你试图预测的东西。