Machine learning 如何在weka中使用TF-IDF以外的特征加权方法?
1) 我想应用像IG、MI这样的特征加权方法来加权我的特征,但StringToWordVector只允许我们在weka中使用TF IDf来加权特征 我是否可以采用TF-IDF以外的加权方法对我的条款进行加权 2) 如何访问java代码中每个特性的TF-IDF权重?我调试了代码,发现所有术语的权重都是1.0Machine learning 如何在weka中使用TF-IDF以外的特征加权方法?,machine-learning,weka,text-classification,Machine Learning,Weka,Text Classification,1) 我想应用像IG、MI这样的特征加权方法来加权我的特征,但StringToWordVector只允许我们在weka中使用TF IDf来加权特征 我是否可以采用TF-IDF以外的加权方法对我的条款进行加权 2) 如何访问java代码中每个特性的TF-IDF权重?我调试了代码,发现所有术语的权重都是1.0 filterInstances.attribute(i).weight() // filter instances is set of instances after applying tf
filterInstances.attribute(i).weight() // filter instances is set of instances after applying tf-idf
3) IG小于0的术语是否对分类过程没有帮助,我们应该总是从词汇表中删除它们
Thanx提前