Text 如何在文本分类中发现信息增益?

Text 如何在文本分类中发现信息增益?,text,classification,Text,Classification,我正在使用决策树进行文本分类,决策树使用信息增益作为文本文档分类的主要值。我通过TF*IDF值提取了一些特征。但我不知道如何准确计算信息增益?有一些文章对此提出了建议,但没有一篇文章非常清楚如何将其应用于文本文件 您可以使用weka计算信息增益。在wekainfogainattributeval.java中 类将计算关于文档的单词的IG。这可能会对您有所帮助。@Subodh Mankar如果有任何问题,请询问我如果您觉得我的答案有帮助,您可以投票并选择我的答案

我正在使用决策树进行文本分类,决策树使用信息增益作为文本文档分类的主要值。我通过TF*IDF值提取了一些特征。但我不知道如何准确计算信息增益?有一些文章对此提出了建议,但没有一篇文章非常清楚如何将其应用于文本文件

您可以使用weka计算信息增益。在weka
infogainattributeval.java中

类将计算关于文档的单词的IG。这可能会对您有所帮助。

@Subodh Mankar如果有任何问题,请询问我如果您觉得我的答案有帮助,您可以投票并选择我的答案