Machine learning 如何测试内核是否为有效内核

Machine learning 如何测试内核是否为有效内核,machine-learning,data-mining,svm,Machine Learning,Data Mining,Svm,如果我定义了自己的方法来确定我的支持向量机分类器的两个输入实体之间的相似性,并因此将其定义为我的内核,那么如何验证它是否确实是我可以使用的有效内核 例如,如果我的输入是字符串,我选择的内核是某种字符串距离度量,那么我如何决定是否可以将其用于SVM。我知道一个有效的SVM内核有一些条件。有谁能告诉我它们是什么以及如何验证这些条件吗?内核函数必须满足您也可以找到您在上所问问题的答案。最直接的测试基于以下内容:当且仅当任何特定数据点集的内核矩阵有效时,内核函数才有效具有所有非负特征值。您可以通过获取一

如果我定义了自己的方法来确定我的支持向量机分类器的两个输入实体之间的相似性,并因此将其定义为我的内核,那么如何验证它是否确实是我可以使用的有效内核


例如,如果我的输入是字符串,我选择的内核是某种字符串距离度量,那么我如何决定是否可以将其用于SVM。我知道一个有效的SVM内核有一些条件。有谁能告诉我它们是什么以及如何验证这些条件吗?

内核函数必须满足您也可以找到您在上所问问题的答案。

最直接的测试基于以下内容:当且仅当任何特定数据点集的内核矩阵有效时,内核函数才有效具有所有非负特征值。您可以通过获取一组相当大的数据点并简单地检查它是否为真来轻松测试这一点。例如,如果您随机选择了2000个数据样本,创建了相应的2000x2000内核矩阵,并观察到它具有非负特征值,那么很可能您具有合法内核。或者,如果存在任何负特征值,那么候选核函数肯定不是合法的核。

您还可以查看作者提供的“核代数”参考资料这是从上面的陈述中得到的——Mercer定理,相应的核矩阵是对称半正定的,正特征值由此而来。作者还举例说明了高斯函数是一个有效的核函数。如果您不想查找参考资料,我将在此处提供:

谢谢。另一篇文章的链接非常有用。