Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/neo4j/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 基于libsvm的文本分类#_C#_Libsvm - Fatal编程技术网

C# 基于libsvm的文本分类#

C# 基于libsvm的文本分类#,c#,libsvm,C#,Libsvm,我使用libsvm来预测情绪。我想知道输入的格式是什么 假设我使用单词计数 [label] [index]:[value] [index]:[value] 这是libsvm所需的格式。那么这是否意味着我只有两个标签(一个为正,一个为负),索引将是该标签下的每个单词,值将是每个单词的频率 这是否也意味着我需要存储word到索引的映射,以便在测试集中使用?请查看libsvm中给出的示例文件。它被称为心音标度。接下来…这是一个很好的例子…LIBSVM使用所谓的“稀疏”格式,其中不需要存储零

我使用libsvm来预测情绪。我想知道输入的格式是什么 假设我使用单词计数

     [label] [index]:[value] [index]:[value]
这是libsvm所需的格式。那么这是否意味着我只有两个标签(一个为正,一个为负),索引将是该标签下的每个单词,值将是每个单词的频率


这是否也意味着我需要存储word到索引的映射,以便在测试集中使用?

请查看libsvm中给出的示例文件。它被称为心音标度。接下来…这是一个很好的例子…

LIBSVM使用所谓的“稀疏”格式,其中不需要存储零值。因此,数据具有属性
5020
表示为
1:53:2
因此,您只需要指定非零属性的索引和


标签位于第一列。对于二进制情况,可以使用+1表示正样本,使用-1表示负样本。顺便说一下,您不仅限于2个标签。您可以使用其他数字(例如1,2,3,4,5等)

好的,那么5表示该特定句子中的单词计数(假设我们按句子进行),1表示字典中单词的索引?