Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/fortran/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Text 如何为多标签文本分类创建ARFF数据集_Text_Weka_Arff_Multilabel Classification - Fatal编程技术网

Text 如何为多标签文本分类创建ARFF数据集

Text 如何为多标签文本分类创建ARFF数据集,text,weka,arff,multilabel-classification,Text,Weka,Arff,Multilabel Classification,下午好 嗯,我想执行多标签文本分类,因此,我选择MEKA(Weka的扩展)来执行此任务。但是,我需要将文档转换为文字向量,我使用GUI Weka,但正如您所知,它只执行双分类,因此我倾向于使用MEKA来执行此任务, 问题是如何创建具有多个标签的arff文件 以下是一个例子: 这是文本 在存在十四醛的情况下,在2A°C下将FMNH(2)添加到弧菌harveyi荧光素酶中,可形成高荧光瞬态物种,其光谱分布与生物发光的光谱分布不可区分。生物发光在1.5秒内达到最大强度,并以复杂的方式衰减,指数分量为1

下午好

嗯,我想执行多标签文本分类,因此,我选择MEKA(Weka的扩展)来执行此任务。但是,我需要将文档转换为文字向量,我使用GUI Weka,但正如您所知,它只执行双分类,因此我倾向于使用MEKA来执行此任务, 问题是如何创建具有多个标签的arff文件 以下是一个例子: 这是文本

在存在十四醛的情况下,在2A°C下将FMNH(2)添加到弧菌harveyi荧光素酶中,可形成高荧光瞬态物种,其光谱分布与生物发光的光谱分布不可区分。生物发光在1.5秒内达到最大强度,并以复杂的方式衰减,指数分量为10(-1)s(-1),7 x 10(-3)s(-1)。和7x10(4)s(-1)

标签包括:

“FM”、“Fl”、“Ki”、“Luc”、“Lum”、“时间因素”

我想要得到的结果是:

@属性L-类{Luc,Lum,Limb,…}

@属性F类{FM,Fl,Foot,…}

@属性o类{Ki,TimeFactors,成人,老年,…}

@属性所有单词的频率

@资料

FM、Fl、Ki、Luc、Lum、时间因子、2、4、6、8、8、7、4、0、1、2、2

首字母缩略词是标签,数字是文本中每个术语出现的频率。
如果有人能帮助我,我将非常感激。

你找到解决办法了吗?我正试图做同样的事情,但遇到了一些问题。你找到解决办法了吗?我正试图做同样的事情,但遇到了一些问题。