Text 如何为多标签文本分类创建ARFF数据集
下午好 嗯,我想执行多标签文本分类,因此,我选择MEKA(Weka的扩展)来执行此任务。但是,我需要将文档转换为文字向量,我使用GUI Weka,但正如您所知,它只执行双分类,因此我倾向于使用MEKA来执行此任务, 问题是如何创建具有多个标签的arff文件 以下是一个例子: 这是文本 在存在十四醛的情况下,在2A°C下将FMNH(2)添加到弧菌harveyi荧光素酶中,可形成高荧光瞬态物种,其光谱分布与生物发光的光谱分布不可区分。生物发光在1.5秒内达到最大强度,并以复杂的方式衰减,指数分量为10(-1)s(-1),7 x 10(-3)s(-1)。和7x10(4)s(-1) 标签包括: “FM”、“Fl”、“Ki”、“Luc”、“Lum”、“时间因素” 我想要得到的结果是: @属性L-类{Luc,Lum,Limb,…} @属性F类{FM,Fl,Foot,…} @属性o类{Ki,TimeFactors,成人,老年,…} @属性所有单词的频率 @资料 FM、Fl、Ki、Luc、Lum、时间因子、2、4、6、8、8、7、4、0、1、2、2 首字母缩略词是标签,数字是文本中每个术语出现的频率。Text 如何为多标签文本分类创建ARFF数据集,text,weka,arff,multilabel-classification,Text,Weka,Arff,Multilabel Classification,下午好 嗯,我想执行多标签文本分类,因此,我选择MEKA(Weka的扩展)来执行此任务。但是,我需要将文档转换为文字向量,我使用GUI Weka,但正如您所知,它只执行双分类,因此我倾向于使用MEKA来执行此任务, 问题是如何创建具有多个标签的arff文件 以下是一个例子: 这是文本 在存在十四醛的情况下,在2A°C下将FMNH(2)添加到弧菌harveyi荧光素酶中,可形成高荧光瞬态物种,其光谱分布与生物发光的光谱分布不可区分。生物发光在1.5秒内达到最大强度,并以复杂的方式衰减,指数分量为1
如果有人能帮助我,我将非常感激。你找到解决办法了吗?我正试图做同样的事情,但遇到了一些问题。你找到解决办法了吗?我正试图做同样的事情,但遇到了一些问题。