Debugging 是否有易于调试的机器学习系统?

Debugging 是否有易于调试的机器学习系统?,debugging,machine-learning,neural-network,svm,hidden-markov-models,Debugging,Machine Learning,Neural Network,Svm,Hidden Markov Models,通常机器学习系统表现良好。然而,当训练好的机器学习系统出现问题时,例如,机器学习系统的性能比随机学习系统差。。。这个伟大的猜谜游戏开始了。在猜谜游戏中,我暗指我的经历。对我来说,调试机器学习系统通常是通过猜测问题来完成的,而不是通过方法学的方式 由于机器学习系统可能失败的原因很多,因此找到真正的错误可能非常耗时。例如,该错误可能是由于: 有偏训练数据集 培训数据不足 包含错误的数据集 不具代表性/功能太多 例如,在神经元网络中,当训练数据不是随机呈现时,进行草率的训练 ... 是否有易于调试的机

通常机器学习系统表现良好。然而,当训练好的机器学习系统出现问题时,例如,机器学习系统的性能比随机学习系统差。。。这个伟大的猜谜游戏开始了。在猜谜游戏中,我暗指我的经历。对我来说,调试机器学习系统通常是通过猜测问题来完成的,而不是通过方法学的方式

由于机器学习系统可能失败的原因很多,因此找到真正的错误可能非常耗时。例如,该错误可能是由于:

有偏训练数据集 培训数据不足 包含错误的数据集 不具代表性/功能太多 例如,在神经元网络中,当训练数据不是随机呈现时,进行草率的训练 ... 是否有易于调试的机器学习系统?如何调试呢


是否有一种已知的调试机器学习系统的方法?

在机器学习社区中,您所谓的调试就是优化。虽然有一些方法可以根据分类器和问题来优化分类器,但没有标准的方法。例如,在一个文本分类问题中,您可能会通过实验发现,如果您使用某些特征训练分类器,那么分类器的性能将得到增强。有一些选择特征组合的方法可以使分类器获得最高的分类精度。其中一些方法涉及使用遗传算法来寻找最佳特征组合。您可以了解的一种方法是顺序特征选择。也有很多关于这类主题的论文,你可能会觉得有用。 此外,还有一些研究改变分类器实现中的分类函数或其他计算,以获得更好的分类结果

话虽如此,也有一些优化分类器的方法被认为是欺骗的,应该避免,这通常是当分类器被优化为仅在单个数据集或高度相似的数据集上解决问题,而不是在其他以前看不见的数据集上解决问题时