Machine learning 如何使用weka将电子邮件数据表示为基于讨论主题的分类输入?

Machine learning 如何使用weka将电子邮件数据表示为基于讨论主题的分类输入?,machine-learning,classification,weka,document-classification,Machine Learning,Classification,Weka,Document Classification,重复: 如果我的数据是电子邮件,即文本数据,那么分类器的输入是什么?电子邮件中的属性/特征集是什么,我需要考虑基于讨论主题进行分类? < P>,通常使用TF IDF将输入数据转换成稀疏向量。

重复:


如果我的数据是电子邮件,即文本数据,那么分类器的输入是什么?电子邮件中的属性/特征集是什么,我需要考虑基于讨论主题进行分类?

< P>,通常使用TF IDF将输入数据转换成稀疏向量。