Machine learning 将训练数据转换到另一个空间,以便我们可以找到超平面

Machine learning 将训练数据转换到另一个空间,以便我们可以找到超平面,machine-learning,svm,Machine Learning,Svm,我想知道我们如何知道将数据转换到哪个空间?使用什么方法查找适当的映射函数 假设我们在二维空间中有10个训练用例不是线性可分的,但是如果我们将它们从F(X,Y):(X,Y)->(X,Y^2)或G:(X,Y)->(X,e^Y)进行变换,它们是线性可分的 首先,我们如何确定函数F和G将起作用?通过观察?然后我们如何决定使用哪个函数?支持向量机通过核函数将映射到不同的空间。因此,要训练支持向量机,不需要将数据映射到线性可分离的位置,只需训练具有适当(非线性)核的支持向量机。在给定正确内核的情况下,它可以

我想知道我们如何知道将数据转换到哪个空间?使用什么方法查找适当的映射函数

假设我们在二维空间中有10个训练用例不是线性可分的,但是如果我们将它们从F(X,Y):(X,Y)->(X,Y^2)或G:(X,Y)->(X,e^Y)进行变换,它们是线性可分的


首先,我们如何确定函数F和G将起作用?通过观察?然后我们如何决定使用哪个函数?

支持向量机通过核函数将映射到不同的空间。因此,要训练支持向量机,不需要将数据映射到线性可分离的位置,只需训练具有适当(非线性)核的支持向量机。在给定正确内核的情况下,它可以学习线性不可分函数。尝试rbf,以及多项式核。还可以使用C超参数

这可能不是你想要的答案,但很多机器学习都是尝试一下,看看吧。在这种情况下,多项式核似乎适合给定您的状态,但rbf往往工作得很好

“我们如何首先通过观察确定函数F和G是否有效?”

差不多。。。就我所知,目前还没有已知的条件可以保证映射后的线性可分性

“那么我们如何决定使用哪个函数?”


有些函数比其他函数更容易调整。例如,RBF非常适用于大多数数据,但每样东西都有一个陷阱,所以如果你的数据是无界的,你将失去通用性。所以这是一个折衷的问题

干杯,我一直在查找一些关于核函数的信息,它们似乎让我们不必将所有的训练案例转换为更高的维度。然而,我不明白一个任意的核函数是如何自动产生一个线性分离数据的映射的……似乎我们仍然有同样的问题,必须定义核函数,以便正确地分离数据?我不知道该怎么做?谁是那个把这个问题划上句号的笨蛋,为什么?