Machine learning “新加坡元模型”；“过度自信”；_Machine Learning_Classification_Mahout

Machine learning “新加坡元模型”；“过度自信”；

machine-learning

Machine learning “新加坡元模型”；“过度自信”；,machine-learning,classification,mahout,Machine Learning,Classification,Mahout,我正在使用ApacheMahout处理二进制分类问题。我使用的算法是纯逻辑回归，而我目前使用的模型倾向于产生预测，预测值为1或0，没有任何中间值请建议一种调整算法的方法，使其在预测中产生更多中间值提前谢谢通过读取文档，您似乎可以控制正则化参数lambda。增加lambda意味着您的权重接近于0，因此您的预测更加模糊。分类器的测试错误率是多少？如果接近零，那么自信是一个特性，而不是一个bug 如果测试错误率很高（或者至少不低），那么分类器可能过度拟合了训练集：测量训练错误和测试错误之间的差异

我正在使用ApacheMahout处理二进制分类问题。我使用的算法是纯逻辑回归，而我目前使用的模型倾向于产生预测，预测值为1或0，没有任何中间值

请建议一种调整算法的方法，使其在预测中产生更多中间值

提前谢谢

通过读取文档，您似乎可以控制正则化参数lambda。增加lambda意味着您的权重接近于0，因此您的预测更加模糊。

分类器的测试错误率是多少？如果接近零，那么自信是一个特性，而不是一个bug

如果测试错误率很高（或者至少不低），那么分类器可能过度拟合了训练集：测量训练错误和测试错误之间的差异。在这种情况下，按照雷纳德的建议增加正规化可能会有所帮助

若您的分类器并没有过度拟合，那个么概率校准可能会有问题。逻辑回归模型（例如，使用logit链接函数）应产生足够好的概率校准（如果问题近似线性可分且标签不太嘈杂）。您可以使用图检查概率校准，如中所述。如果这确实是一个校准问题，那么基于Platt标度或等渗回归实施自定义校准可能有助于解决该问题。

是的，我使用过lambda。如果值足以产生我想要的值，则模型的精度会大大降低。我有一个扩展正则化方法的想法，即不仅在模型的权重值过高时，而且在模型的预测值过高时（在应用sigmoid函数之前），给模型加上惩罚。你能说些什么？