Machine learning 非线性支持向量机核维数_Machine Learning_Computer Vision_Svm_Libsvm_Pattern Recognition

Machine learning 非线性支持向量机核维数

machine-learning computer-vision

Machine learning 非线性支持向量机核维数,machine-learning,computer-vision,svm,libsvm,pattern-recognition,Machine Learning,Computer Vision,Svm,Libsvm,Pattern Recognition,我在理解非线性支持向量机的内核方面有一些问题。首先，我对非线性支持向量机的理解是：使用核函数将输入转换到一个非常高维的空间，在这个空间中，转换后的输入可以被一个线性超平面分离内核，例如：RBF： K(x_i, x_j) = exp(-||x_i - x_j||^2/(2*sigma^2)); 其中x_i和x_j是两个输入。这里我们需要改变sigma以适应我们的问题 (1) Say if my input dimension is d, what will b

我在理解非线性支持向量机的内核方面有一些问题。首先，我对非线性支持向量机的理解是：使用核函数将输入转换到一个非常高维的空间，在这个空间中，转换后的输入可以被一个线性超平面分离

内核，例如：RBF：

         K(x_i, x_j) = exp(-||x_i - x_j||^2/(2*sigma^2));

其中x_i和x_j是两个输入。这里我们需要改变sigma以适应我们的问题

       (1) Say if my input dimension is d, what will be the dimension of the 
           transformed space?

       (2) If the transformed space has a dimension of more than 10000 is it 
           effective to use a linear SVM there to separate the inputs?

转换通常会增加数据的维度数量，但不一定非常高。视情况而定。RBF核是最流行的核函数之一。它在每个数据点周围添加一个“凹凸”。相应的特征空间是无限维的希尔伯特空间

在不知道数据的具体背景的情况下，很难判断转换为10000维对分类是否有效。然而，为您的问题选择一个好的映射（编码先验知识+获得正确的函数类复杂性）可以改善结果

例如，包含60K训练示例和10K测试示例，其中包含28x28个二进制图像

线性支持向量机的测试误差约为8.5%
多项式支持向量机的测试误差约为1%

利润有多大
训练集上的错误