Artificial intelligence 帮助——LibSVM的100%准确率？_Artificial Intelligence_Machine Learning_Computer Vision_Svm_Libsvm

Artificial intelligence 帮助——LibSVM的100%准确率？

artificial-intelligence machine-learning computer-vision

Artificial intelligence 帮助——LibSVM的100%准确率？,artificial-intelligence,machine-learning,computer-vision,svm,libsvm,Artificial Intelligence,Machine Learning,Computer Vision,Svm,Libsvm,名义上这是一个很好的问题，但我很确定这是因为发生了一些有趣的事情作为背景，我正在研究面部表情/识别领域的一个问题，因此获得100%的准确率似乎难以置信（这在大多数应用中并不合理…）。我猜数据集中可能存在一些一致的偏差，这使得支持向量机很容易得出答案，=或者=，更可能的是，我在支持向量机方面做错了什么我正在寻找一些建议来帮助理解正在发生的事情——是我吗？还是数据详情如下: 大约2500个标记的数据向量/实例（个体的转换视频帧--尽管细节中有魔鬼，但这里有三个简单的测试可以尝试：快速（~2

名义上这是一个很好的问题，但我很确定这是因为发生了一些有趣的事情

作为背景，我正在研究面部表情/识别领域的一个问题，因此获得100%的准确率似乎难以置信（这在大多数应用中并不合理…）。我猜数据集中可能存在一些一致的偏差，这使得支持向量机很容易得出答案，=或者=，更可能的是，我在支持向量机方面做错了什么

我正在寻找一些建议来帮助理解正在发生的事情——是我吗？还是数据

详情如下:

大约2500个标记的数据向量/实例（个体的转换视频帧--尽管细节中有魔鬼，但这里有三个简单的测试可以尝试：
快速（~2分钟）：通过决策树算法运行数据。这在Matlab中可通过
```
classregtree
```
获得，或者您可以加载到R中并使用
```
rpart
```
。这可以告诉您是否有一个或几个特性恰好提供了完美的分离
不太快（约10-60分钟，取决于您的基础设施）：迭代拆分功能（即从900组到2组450组）、训练和测试。如果其中一个子集为您提供了完美的分类，请再次拆分。只需不到10次此类拆分即可找出问题变量的位置。如果发生“中断”由于还有许多变量（甚至在第一次拆分中），请选择不同的随机特征子集，一次删除较少的变量，等等。拆分数据不可能需要全部900个变量
更深入的分析（几分钟到几个小时）：尝试标签的排列。如果您可以排列所有标签，并且仍然获得完美的分离，那么您的训练/测试设置中会出现一些问题。如果您选择越来越大的子集进行排列（或者，如果选择其他方向，则保持静止）你可以看到你在哪里开始失去可分性。或者，考虑减少你的训练集大小，如果你用一个非常小的训练集获得可分离性，那么有些东西是怪异的。