Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/sharepoint/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Machine learning 如何在weka中使用TF-IDF以外的特征加权方法?_Machine Learning_Weka_Text Classification - Fatal编程技术网

Machine learning 如何在weka中使用TF-IDF以外的特征加权方法?

Machine learning 如何在weka中使用TF-IDF以外的特征加权方法?,machine-learning,weka,text-classification,Machine Learning,Weka,Text Classification,1) 我想应用像IG、MI这样的特征加权方法来加权我的特征,但StringToWordVector只允许我们在weka中使用TF IDf来加权特征 我是否可以采用TF-IDF以外的加权方法对我的条款进行加权 2) 如何访问java代码中每个特性的TF-IDF权重?我调试了代码,发现所有术语的权重都是1.0 filterInstances.attribute(i).weight() // filter instances is set of instances after applying tf

1) 我想应用像IG、MI这样的特征加权方法来加权我的特征,但StringToWordVector只允许我们在weka中使用TF IDf来加权特征

我是否可以采用TF-IDF以外的加权方法对我的条款进行加权

2) 如何访问java代码中每个特性的TF-IDF权重?我调试了代码,发现所有术语的权重都是1.0

 filterInstances.attribute(i).weight() // filter instances is set of instances after applying tf-idf
3) IG小于0的术语是否对分类过程没有帮助,我们应该总是从词汇表中删除它们

Thanx提前