Machine learning SVM算法是我的模型有效的_Machine Learning_Svm

Machine learning SVM算法是我的模型有效的

machine-learning

Machine learning SVM算法是我的模型有效的,machine-learning,svm,Machine Learning,Svm,我有一个数据集，一个大数据集。我使用T-SNE绘制数据，我找不到线性可分离决策边界，因为我在其中找不到决策边界我尝试了SVM，并希望它能够工作，如果它能够在更高的维度分离超平面目前，我得到了94%的训练准确率，但后来当我将数据集的大小增加20000个条目时，我收到了50%的测试错误。训练数据的准确率增加到65%（在交叉验证中也差不多），训练准确率仍然是93%。我的问题是，我真的准确地解决了这个机器学习问题吗？或者我的方向错了，如果可能的话，有人能给我提供一些关于解决问题的实用方法的链接。看

我有一个数据集，一个大数据集。我使用T-SNE绘制数据，我找不到线性可分离决策边界，因为我在其中找不到决策边界

我尝试了SVM，并希望它能够工作，如果它能够在更高的维度分离超平面

目前，我得到了94%的训练准确率，但后来当我将数据集的大小增加20000个条目时，我收到了50%的测试错误。训练数据的准确率增加到65%（在交叉验证中也差不多），训练准确率仍然是93%。

我的问题是，我真的准确地解决了这个机器学习问题吗？或者我的方向错了，如果可能的话，有人能给我提供一些关于解决问题的实用方法的链接。

看来你对数据有问题。基本上，您的SVM正在记忆训练数据，无法正确预测以前从未见过的新数据。您可以尝试使用较小的

来减少过度装配

我认为一般来说，很难说支持向量机是否是解决问题的正确方法。有一个假设，可能没有一个单一的机器学习算法来解决所有的问题，我目前还不知道有什么方法可以将问题映射到它们的最优算法

您可能应该使用SVM修复当前方法中的明显错误，然后研究它失败的地方和原因。如果您已经这样做了，您可能可以选择另一种算法来解决这些缺点。

感谢您提供的信息Sietschie。我将尝试向当前问题添加更多数据，然后尝试sklearn库的网格搜索。我们将了解svm的性能。根据这一点，我将看到SVM在当前情况下是否表现良好，或者在了解导致以下问题的原因后，是否会切换到不同的算法。谢谢你的建议。