Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/83.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
支持向量机在R,训练数据集_R_Machine Learning_Classification_Svm_Training Data - Fatal编程技术网

支持向量机在R,训练数据集

支持向量机在R,训练数据集,r,machine-learning,classification,svm,training-data,R,Machine Learning,Classification,Svm,Training Data,更一般的问题,但因为我使用的是R->tags 我的训练数据集是15000个条目,其中大约有20个我想用于正数据集->构建svm。我想使用剩余的重采样数据集作为负数据集,但我想知道,最好采用与负数据集相同的大小(大约20),否则它会很高吗?在1000轮重采样后,是否有一种简单的方法来汇集R中的分类器(基于集合)?(甚至使用e1071软件包) 接下来的问题:我想计算一个分数为每个预测之后,它是罚款只是采取概率乘以100 Thx您可以尝试“类权重”方法,在这种方法中,较小的类会获得更多的权重,因此错误

更一般的问题,但因为我使用的是R->tags

我的训练数据集是15000个条目,其中大约有20个我想用于正数据集->构建svm。我想使用剩余的重采样数据集作为负数据集,但我想知道,最好采用与负数据集相同的大小(大约20),否则它会很高吗?在1000轮重采样后,是否有一种简单的方法来汇集R中的分类器(基于集合)?(甚至使用
e1071
软件包)

接下来的问题:我想计算一个分数为每个预测之后,它是罚款只是采取概率乘以100


Thx

您可以尝试“类权重”方法,在这种方法中,较小的类会获得更多的权重,因此错误地将正面标记的类分类会花费更多的成本。

这有点笼统,但措辞也含糊不清。条目=功能?还是样品?我猜是20个样本?我建议您查看网页上的
caret
软件包,该软件包对此类问题有非常清楚的解释:谢谢stephen,features=5,20个样本,scusi!