Machine learning “新加坡元模型”;“过度自信”;

Machine learning “新加坡元模型”;“过度自信”;,machine-learning,classification,mahout,Machine Learning,Classification,Mahout,我正在使用ApacheMahout处理二进制分类问题。我使用的算法是纯逻辑回归,而我目前使用的模型倾向于产生预测,预测值为1或0,没有任何中间值 请建议一种调整算法的方法,使其在预测中产生更多中间值 提前谢谢 通过读取文档,您似乎可以控制正则化参数lambda。增加lambda意味着您的权重接近于0,因此您的预测更加模糊。分类器的测试错误率是多少?如果接近零,那么自信是一个特性,而不是一个bug 如果测试错误率很高(或者至少不低),那么分类器可能过度拟合了训练集:测量训练错误和测试错误之间的差异

我正在使用ApacheMahout处理二进制分类问题。我使用的算法是纯逻辑回归,而我目前使用的模型倾向于产生预测,预测值为1或0,没有任何中间值

请建议一种调整算法的方法,使其在预测中产生更多中间值


提前谢谢

通过读取文档,您似乎可以控制正则化参数lambda。增加lambda意味着您的权重接近于0,因此您的预测更加模糊。

分类器的测试错误率是多少?如果接近零,那么自信是一个特性,而不是一个bug

如果测试错误率很高(或者至少不低),那么分类器可能过度拟合了训练集:测量训练错误和测试错误之间的差异。在这种情况下,按照雷纳德的建议增加正规化可能会有所帮助


若您的分类器并没有过度拟合,那个么概率校准可能会有问题。逻辑回归模型(例如,使用logit链接函数)应产生足够好的概率校准(如果问题近似线性可分且标签不太嘈杂)。您可以使用图检查概率校准,如中所述。如果这确实是一个校准问题,那么基于Platt标度或等渗回归实施自定义校准可能有助于解决该问题。

是的,我使用过lambda。如果值足以产生我想要的值,则模型的精度会大大降低。我有一个扩展正则化方法的想法,即不仅在模型的权重值过高时,而且在模型的预测值过高时(在应用sigmoid函数之前),给模型加上惩罚。你能说些什么?